Neo4j 对 于 大 多 数 人 来 说 ， 可 能 是 比较 陌生 的 。 其 实 ，Neo4j 是 一 个 图 形 数据 库 的 名 字 ， 就 像 传统 关系 数据 库 中 的 Otacle 和 
SQL Server 一 样 。 图 形 数 据 库 是 一 个 比较 新 的 概念 。 大 家 所 熟悉 的 传统 关系 数据 库 的 查询 使 用 的 是 结构 化 查询 语言 ， 即 
SQL (Structured Quety Language) 。 而 像 Neo4j 这 样 的 图 形 数 据 库 (Neo4j 属 于 NoSQL 数 据 库 的 一 种 ) 是 最 近 几 年 发 展 起 来 的 新 技 
术 。 随 着 大 数据 时 代 的 到 来 ， 常 规 的 关系 数据 库 技术 已 显得 力不从心 ， 因 此 ， 应 运 而 生 的 是 能 应 对 海量 数据 的 新 型 数据 库 技 
术 ，Neo4j 就 是 其 中 的 佼佼 者 。 


本 书 是 一 本 从 基础 知识 到 实际 应 用 项 目 开发 的 教科 书 ， 作 者 均 来 自 相 关公 司 的 开发 和 技术 部 门 ， 有 着 深 厚 的 应 用 和 技术 背 
景 。 本 书 以 实例 为 依托 ， 详 细 地 对 实例 做 建 模 分 析 ， 并 给 出 经 过 测试 的 源 代 码 ， 读 者 可 以 按照 相关 步骤 实现 实例 ， 这 是 一 种 学 习 
建 模 和 编程 的 极 好 方法 。 


参加 本 书 翻译 的 有 张 乘 森 、 孔 倩 和 张 晨 策 。 其 中 张 乘 森 负责 翻译 第 1 章 、 第 2 章 、 第 7 章 、 第 8 章 、 第 9 章 、 第 10 章 和 第 11 章 以 
及 附录 等 ， 孔 倩 负 责 翻 译 第 3 章 和 第 4 章 ， 张 蝴 策 负责 翻译 第 5 章 和 第 6 章 。 全 书 由 张 乘 森 负责 统一 校对 和 审 稿 。 


由 于 本 书 的 主要 内 容 都 是 比较 新 的 技术 ， 而 且 作 者 完全 从 技术 的 角度 编写 本 书 ， 涉 及 的 技术 内 容 多 ， 专 业 跨 度 大 ， 给 本 书 的 
翻译 工作 增加 了 不 少 的 难度 。 尺 管 译 者 始终 仔细 求证 与 琢磨 ,但 是 难免 还 会 有 疏漏 和 错误 ， 吓 请 广大 读者 不 言 赐 教 。 译 者 的 联系 
方式 : 331006787@qq.com。 


序言 


数据 库 领 域 正在 经 历 着 一 场 巨 大 的 变革 ， 关 系数 据 库 的 霸权 地 位 已 经 动 播 ， 受 到 NoSQL 旗 下 大 量 新 技术 的 挑战 。 其 中 ， 图 
形 数据 库 在 分 析 各 领域 数据 方面 日 益 成 为 一 种 重要 工具 。 


大 多 数 NoSQL 数 据 库 用 于 解决 关系 数据 库 在 性 能 上 明显 的 限制 ， 关 系数 据 库 遇 到 以 指数 增长 的 数据 量 时 ， 就 会 出 现 难 以 应 
付 的 局 面 ， 这 在 过 去 的 几 年 中 我 们 已 经 亲眼 目睹 过 。 但 是 ， 数 据 量 的 增加 只 是 我 们 面 对 的 诸多 挑战 之 一 。 不 仅仅 是 数据 量 的 增 
加 ， 而 且 数 据 变 得 越 来 越 交 叉 互 联 ， 结 构 也 越 来 越 多 样 化 。 简 而 言 之 ， 数 据 正 在 变 得 越 来 越 复杂 ， 远 远 超出 连接 的 概念 。 


为 了 解决 性 能 和 可 扩展 性 问题 ，NoSQL 已 经 普遍 放弃 了 关系 模型 处 理 交 叉 互 联 数据 的 方式 。 而 图 形 数据 库 开辟 了 互联 数据 
的 世界 ， 其 性 能 超出 了 关系 数据 库 几 个 数量 级 。 如 果 我 们 想 从 数据 中 得 到 许多 最 有 趣 的 问题 的 结果 ， 则 要 求 我 们 不 但 能 理解 许多 
东西 是 相互 关联 的 ， 而 且 也 要 理解 这 些 关 联 中 有 许多 不 同 。 图 形 数据 库 为 这 种 理解 提供 了 功能 最 强大 和 性 能 最 佳 的 方式 。 


关联 的 数据 给 大 多 数 的 NoSQL 数 据 库 带 来 了 许多 困难 ， 这 需要 以 作为 不 连接 的 聚合 管理 文档 、 列 或 键 / 值 对 。 要 使 用 这 些 技 
术 创 建 任何 连接 的 外 观 ， 我 们 必须 找到 一 种 既 适 合 使 数据 非 标 准 化 也 适合 回避 实质 上 不 连接 的 模型 中 连接 的 方法 。 当 我 们 在 建立 
Neo4j 的 时 候 ， 就 发 现 这 并 不 是 一 件 容易 的 事情 ! 


相对 于 同一 时 间 段 NoSQI 令 域 的 佼佼 者 ，Neo4j 已 经 到 了 开花 结果 的 时 候 了 (事实 上 ， 在 技术 上 ，Neo4j 已 经 超前 了 许多 其 他 
NoSQL 技 术 好 几 年 ) 。Neo4j 为 高 连接 数据 提供 了 类 传统 数据 库 的 支持 (包括 事务 的 安全 性 ) ， 同 时 在 性 能 上 也 比 传统 数 据 库 高 
出 几 个 数量 级 (从 分 钟 级 别提 高 到 党 秒 级 别 ) 。 对 于 社会 计算 、 推 荐 引擎 、 电 信 、 授 权 和 访问 控制 、 路 由 和 物流 、 产 品目 录 、 数 


据 中 心 管理 、 职 业 管理 、 用 ， 事 实证 明 它 是 应 对 复杂 数据 的 一 个 理想 选 


笃 。 


坎 诈 探测 、 治 安 和 地 理 空 间 等 各 种 领域 ，Neo4j 都 能 适 
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为 Neo4j 是 目前 最 流行 的 图 形 数据 库 ， 所 以 开发 者 早晚 会 遇 到 。 我 们 知道 一 次 接触 ” 像 Neo4j 这 样 的 新 技术 ， 会 使 人 感 


到 眼花 综 乱 。 关 于 不 同 API、 构 建 、 查 询 语言 和 框架 选择 的 严格 性 往往 会 邻 人 生 旦 ， 这 很 容易 使 人 放弃 。 


本 书 启 发 开发 人 员 快 速 将 Neo4j 运 行 起 来 以 解决 这 些 问 题 。 本 书 结合 实际 编程 例子 来 讲解 Neo4j 的 API 和 查询 语言 ， 提 供 了 基 
于 作者 丰富 的 数据 库 应 用 经 验 的 许多 例子 。 为 了 补充 开发 建议 ， 作 者 也 讨论 部 署 选 项 和 解决 方案 的 体系 结构 。 其 结果 就 像 在 全 系 
统 开发 生命 周期 的 背景 下 所 见 到 的 一 个 圆 形 的 整体 视图 。 


言 ， 


作为 Neo4j 的 贡献 者 和 开发 者 ， 我 们 非常 欣慰 地 看 到 本 书 收 贷 
的 作者 是 来 自 世 界 各 地 的 最 有 经 验 的 Neo4j 用 户 ， 我 们 坚信 他 们 的 威望 和 知识 通 


过 可 重复 的 测试 来 描述 技术 点 。 
给 所 有 的 开发 者 。 


届满 满 ， 实 用 性 很 强 ， 并 通 
过 本 书 能 够 传递 


本 书 


Jim Webber 


NEO TECHNOLOGY 的 首席 科学 家 


Tan Robinson 


NEO TECHNOLOGY 的 工程 师 


从 很 早 以 前 开始 ， 图 形 问 题 就 是 计算 机 编程 中 一 些 最 普遍 


控制 列表 和 映射 家 。 当 要 存储 图 形 的 时 候 ， 程 友 


的 问题 。 回 想 那 时 ， 尤 其 是 在 编程 时 ， 需 要 建立 层次 结构 树 、 访 问 
了 员 将 图 形 转 换 成 表格 并 使 用 关系 数据 库 作 为 低层 存储 。 我 们 不 得 不 做 大 量 的 探究 


来 保存 最 基本 的 图 形 数 据 ， 直 到 有 了 以 Neo4j 为 代表 的 图 形 数据 库 ， 才 有 了 其 他 的 选择 。 
十 多 年 前 ，Neo4j 就 开始 了 它 的 生涯 ，2010 年 正式 发 布 了 1.0 版 本 ，2.0 版 本 是 在 2013 年 12 月 发 布 的。 我 们 当中 的 大 多 数 人 一 直 
在 积极 使 用 Neo4j ， 并 且 见 证 了 它 的 发 展 及 在 不 同 项 目 上 的 应 用 。 图 形 数据 库 ， 尤 其 是 Neo4j ， 获 得 了 越 来 越 高 的 关注 度 ， 越 来 越 


多 的 人 和 公司 认识 到 ， 对 于 复杂 的 、 具 有 挑战 性 的 相互 连接 的 数据 ，Neo 和 j 是 图 形 数据 库 中 唯一 的 健壮 和 坚实 的 解决 方案 。 


我 们 非常 高 兴 能 够 浓缩 我 们 的 真实 工作 经 历 及 知识 编写 成 这 本 实践 性 很 强 的 书 。 本 书 将 为 你 打下 一 个 坚实 的 基础 并 创建 一 些 


帮助 你 尽快 运行 Neo4j 的 项 目 。 


天 于 本 书 


Neo4j 作 为 一 个 图 形 数 据 库 在 过 
已 经 发 展 成 为 适应 许多 语言 和 框架 


去 的 大 约 十 年 间 发 生 了 很 大 的 变化 。 从 一 个 纯粹 在 基于 Java 领 域内 操作 的 图 形 数 据 库 开始 ， 
的 图 形 数 据 库 。 


当 我 们 开始 着 手写 这 本 书 的 时 候 ， 最 新 版 本 是 1.9。Neo4j 2.0 版 本 是 真正 的 规则 颠覆 者 ， 引 进 

(内 置 ) 节点 标签 的 概念 。 

例子 都 已 经 专门 经 过 了 2.0 版 本 的 验证 。 到 本 书 出 版 时 无 疑 还 会 有 新 的 版 本 ， 

应 该 为 你 提供 了 学 习 、 起 步 和 运行 任意 的 核心 Neo4j 2.0+ 版 本 的 基础 知识 和 技能 ， 当 然 ， 


了 新 的 特性 ， 包 括 非 常 期 待 的 


思 台 虑 的 一 步 一 步 的 方法 ， 


因 此 本 书 尽 管 还 有 一 些 与 1.x 相 关 的 内 容 ， 但 是 已 经 更 新 到 涵盖 了 2.0 的 特色 ， 所 有 相关 的 样 例 代 码 和 
然而 ， 本 书 所 采取 的 深 
除了 没有 预见 的 巨大 变化 。 


由 于 Java 是 促使 Neo4j 诞 生 的 语言 ， 因 此 我 们 决定 使 用 Java 作 为 主要 的 语言 以 演示 本 书 的 各 种 技术 和 方法 。 此 外 ， 这 在 以 前 也 
是 唯一 一 种 可 用 语言 ， 语 言 的 选择 也 使 我 们 能 够 包括 一 些 章节 详细 讨论 如 何 明 确 地 利用 本 机 核心 Neo4j API 的 优点 来 做 某 些 工 
作 。 这 当然 对 基于 Java 的 客户 端 是 具有 很 大 好 处 的 。 然 而 ， 如 果 我 们 重新 从 头 开 始 ， 我 们 可 能 会 花 更 多 时 间 来 讲 Cypher， 因 为 
Cyphet 与 图 形 数据 库 交 互 更 加 容易 ， 且 是 跨 平 台 的 ， 包 括 Java、Shell 等 其 他 所 有 平台 。 然 而 ， 我 们 将 这 个 留 作 可 能 的 第 2 版 ， 因 为 
我 们 仍然 相信 本 书 中 有 许多 核心 基本 概念 和 方法 需要 首先 传达 。 本 书 假设 使 用 的 是 最 新 版 本 的 JDK 7。 另外， 本 书 附带 的 样 例 代 
码 使 用 Maven 作 为 我 们 创建 依赖 工具 的 选择 。 对 于 那些 不 熟悉 Maven 的 用 户 ， 附 录 B 中 提供 了 一 个 快速 入 门 帮助 你 起 步 与 进入 正常 
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应 当 指 出 的 是 ， 这 并 不 意味 着 本 书 只 是 一 本 参考 书 。 如 果 是 那样 的 话 ， 本 书 的 篇 幅 将 会 长 很 多 。 本 书 的 目标 是 给 你 足够 的 知 


书 
识 并 理解 每 一 个 希望 精通 的 领域 ， 然 后 再 继续 向 前 。 如 果 你 想 进 一 步 探索 特定 的 领域 ， 书 中 提供 了 相关 内 容 的 链接 ， 在 那里 你 可 
以 得 到 更 多 的 相关 信息 


本 书 章节 编排 


本 书 分 为 三 部 分 。 第 一 部 分 介绍 并 且 涵 盖 数 据 模型 、Neo4 和 入 门 和 强大 的 遍历 功能 。 第 二 部 分 讨论 应 用 程序 的 开发 并 且 涵 盖 


第 1 章 介绍 图 形 数 据 库 的 通用 概念 ， 包 括 浏 览 Neo4j 的 一 些 重 要 方面 和 最 适合 的 应 用 场景 。 该 章 介绍 Neo4j 在 NoSQL 领域 中 能 
解决 的 一 些 问题 ， 包 括 与 传统 关系 数据 库 的 对 比 。 


第 2 章 考察 如 何 及 为 什么 在 Neo 和 j 中 建 模 数 据 ， 包 括 在 图 形 数 据 库 中 数据 建 模 场景 的 通用 方法 。 给 出 了 来 自 不 同 领 域 的 例子 
让 你 了 解 在 Neo4j 中 建 模 的 灵活 性 。 


从 第 3 章 我 们 真正 开始 动手 了 。 该 章 介 绍 Neo 生 核心 Java API， 通 过 创建 一 个 表示 用 户 社交 网 络 和 他 们 喜欢 的 电影 的 图 形 的 所 
有 步骤 来 加 深 理解 。 该 章 涵盖 创建 和 连接 节点 以 及 获取 这 些 节 点 的 附加 信息 。 该 章 也 探讨 区 分 不 同类 型 节点 的 策略 ， 包 括 标签 的 
使 用 。 


第 4 章 建 立 这 个 社交 网 络 的 域 ， 更 深入 地 探讨 核心 API， 尤 其 是 重点 探讨 遍历 功能 (这 里 讲 的 是 Neo4j 遍 历 API) ， 这 是 一 个 
查询 图 形 数据 库 的 强大 方法 。 


第 5 章 介绍 Neo4j 中 可 用 的 索引 策略 。 创 建 和 遍历 图 形 数据 是 非常 棒 的 ， 但 是 你 需要 一 个 找到 起 始点 或 多 个 起 始点 的 策略 ， 起 
点 是 图 形 中 开始 遍历 的 点 。 在 查看 从 Neo4j 2.0 版 本 往 后 可 用 的 内 置 家 引 选 项 前 ， 你 将 从 查看 手动 (传统 ) 索引 开始 。 


第 6 章 介 绍 Cypher， 即 Neo4j 中 人 能 读 懂 的 查询 语言 。 这 一 章 介 绍 Cyphet 的 性 质 ， 演 示 对 图 形 操 作 的 基本 名 法， 也 涵盖 在 Neo4] 
数据 库 的 日 第 开发 和 维护 中 会 用 到 的 高 级 特性 。 


第 7 章 重 点 讨论 在 NoSQL 空 间 中 Neo4j 的 独特 亮点 之 一 一 一 完全 支持 ACID 事务 ， 提 供 一 些 不 同 应 用 的 例子 以 及 在 某 些 方面 更 
深入 的 探究 。 
虽然 从 第 4 章 开 始 接触 遍历 功能 ， 但 编写 高 效 的 遍历 是 成 功 查 询 图 形 数据 的 关键 。 在 第 8 章 ， 我 们 更 深入 地 挖掘 遍历 API 的 内 


部 方法 ， 因 此 你 可 以 学 习 到 如 何以 一 个 有 效 的 方式 用 本 机 API 解 决 最 复杂 的 图 形 问题 。 


第 9 章 讨 论 面向 图 形 对 象 的 库 Spting Data Neo4j (SDN) 。 尽 管 SDN 不 是 Neo4j 官方 提供 的 ， 但 是 该 章 通过 介绍 SDN 来 重点 演 
示 Neo4j 开 源 框架 如 何 作为 一 个 库 去 提供 丰富 的 对 象 图 形 模 型 和 Neo4j 支 持 的 数据 之 间 进 行 可 靠 的 、 无 颖 的 映射 。 该 章 再 一 次 使 用 
我 们 信任 的 用 户 及 其 所 爱 电影 的 社交 网 络 来 演示 这 些 要 点 。 


第 10 章 探讨 在 Neo4j 中 使 用 的 两 种 主要 模式 ， 即 识 入 式 模 式 和 服务 器 模式 ， 本 书 主 要 讲解 谱 入 式 模 式 的 核心 概念 。 该 章 也 介 


绍 了 服务 器 模式 ， 服 务 器 模式 可 以 被 任何 的 客户 端 使 用 ， 并 稍微 深入 地 探讨 每 一 种 模式 ， 比 较 各 自 的 优 缺 点 ， 包 括 如 果 你 选择 的 
是 服务 器 模式 的 话 ， 如 何 充 分 利用 服务 器 。 


第 11 章 介绍 高 级 Neo4j 架 构 。 以 该 知识 为 框架 ， 该 章 探 讨 当 你 准备 将 Neo4j 投 入 到 产品 中 时 应 该 考虑 哪些 因素 ， 包 括 扩展 和 其 


他 使 Neo4j 癌 可 用 性 的 需求 ， 以 及 当 需 要 时 如 何 备份 和 还 原 你 的 数据 库 。 


四 个 附录 指导 你 完成 安装 、 设 置 和 运行 Neo4j ， 还 包括 Maven 和 SDN 以 及 提供 寻求 更 多 帮助 的 信息 。 


代码 约定 和 下 载 


本 书 的 所 有 源 代码 以 代码 体形 式 给 出 。 在 许多 程序 中 ， 以 注释 的 形式 指出 关键 的 概念 ， 在 文本 中 有 时 用 编号 给 出 有 关 代 码 的 
附加 信 息 o 


书 中 给 出 的 大 部 分 代码 能 够 在 随 带 的 样 例 源 代码 中 以 多 种 形式 找到 。 样 例 源 代码 可 以 从 华章 网 站 (www.hzbook.com) 上 免 
费 下 载 。 


样 例 源 代 码 以 一 组 JUnit 样 式 的 测试 结构 给 出 ， 其 目的 是 强调 或 演示 讨论 中 的 特定 代码 。 附 录 B 给 出 了 如 何 运 行 这 些 样 例 源 代 
码 的 说 明 。 
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第 一 部 分 “Neo4j 概 述 


` 第 1 章 ”Neo4j 数 据 库 的 一 个 应 用 案例 
` 第 2 草 ”Neo4j 的 数据 模型 

: 第 3 章 ”Neo4j 开 发 入 门 

. 第 4 章 强大 的 图 形 遍 历 功能 

` 第 5 章 ”数据 索引 


Neo4j 是 什么 ? 它 适 合 于 做 什么 ? 它 是 解决 你 所 涉及 问题 领域 的 数据 库 吗 ? 它 能 做 什么 事情 ? 在 本 书 的 第 一 部 分 ， 我 们 将 回 


答 这 些 问题 。 


第 1 章 介 绍 了 通用 图 形 数 据 库 的 概念 ， 并 开始 探索 一 些 Neo4j 的 关键 内 容 。 第 2 章 继续 探讨 通常 与 图 形 相 关 的 问题 和 领域 ， 并 
把 重点 放 在 不 同情 况 下 的 图 形 数 据 建 模 技 术 和 方法 上 。 第 3 章 至 第 5 章 才 是 我 们 真正 开始 动手 工作 的 部 分 。 书 中 使 用 了 一 个 社交 网 
络 的 用 户 和 他 们 吝 欢 的 电影 作为 例子 ， 探 索 Neo4j 如 何以 核心 API (core API) 来 实现 创建 和 连接 节点 的 基本 功能 以 及 识别 不 同类 
型 节点 的 技术 。 图 形 数 据 的 遍历 也 是 Neo4j 的 一 个 重要 特点 ， 第 4 章 通 过 探讨 Neo4 和 的 遍历 应 用 程序 接口 (Traversal API) 对 其 进行 


了 重点 介绍 [© 


第 5 章 介 绍 了 Neo4j 的 各 种 “索引 (indexing) ”策略 和 提供 的 选项 。 在 查看 从 Neo4j 2.0 及 以 上 版 本 的 内 置 索引 和 可 用 的 选项 
之 前 ， 应 先 以 查看 手动 〈 传 统 ) 选项 开始 。 


第 1 草 ”Neo4j 数 据 库 的 一 个 应 用 案例 


本 章 包 括 以 下 内 容 : 
- 几 个 Neo4j 图 形 数据 库 的 应 用 案例 
. 与 传统 的 关系 数据 库 相 比 ，Neo4j 有 什么 不 同 
. Neo4j 在 大 型 NoSQL 领 域 的 地 位 
* Neo4j 的 主要 特点 


计算 机 科学 与 数学 密切 相关 ， 它 的 很 多 概念 都 来 自 于 数学 的 哲学 。 算 法 、 密 码 学 、 计 算 和 目 动 化 ， 甚 至 连 基 本 的 数学 逻辑 和 
布尔 代数 理论 都 是 数学 概念 ， 正 是 这 些 概 念 将 两 门 学 科 崇 密 地 关联 了 起 来 。 数 学 的 另 一 个 课题 也 经 常 在 计算 机 科学 的 书籍 和 文章 
中 看 到 : 图 论 。 在 计算 机 科学 中 ， 图 形 用 于 表示 特定 的 数据 结构 ， 如 组 织 层级 结构 、 社 交 网 络 以 及 处 理 流程 。 通 常 ， 在 软件 设计 
阶段 ， 结 构 、 流 程 和 算法 用 图 形 流程 图 在 日 板 上 摘 述 。 面 向 对 象 结构 的 计算 机 系统 也 是 以 继承 、 组 成 和 对 象 成 员 作 为 图 形 建 模 
的 。 


尽管 在 软件 开 友 的 过 程 中 广泛 使 用 图 形 ， 但 是 ， 当 涉及 数据 保存 的 时 候 ， 开 友人 员 往 往 志 记 了 图 形 。 我 们 试图 将 数据 北 进 关 
系 型 表格 中 ， 并 对 其 结构 规范 化 和 再 规 学 化 ， 一 直到 它 看 上 去 完全 不 是 它 应 该 表示 的 东西 的 样子 。 


访问 控制 列表 融 是 一 个 例子 。 这 是 许多 企业 应 用 程序 解决 了 一 志 又 一 遍 的 问题 。 通 单 有 用 户 表 、 任 务 表 和 资源 表 。 那 么 残 
有 “多 对 多 ”的 表格 ， 映 射 用 户 对 任务 和 任务 对 资源 。 最 后 ， 至 少 要 有 五 个 关系 型 表格 来 表示 一 个 非常 简单 的 数据 结构 ， 这 其 实 
就 是 一 个 图 形 。 即 使 使 用 一 个 对 铺 关 系 映射 (ORM) 工具 来 映射 这 些 数据 到 对 象 模 型 ， 这 也 是 一 个 图 形 。 


如 果 能 用 数据 的 目 然 形式 表示 数据 ， 使 数据 的 映射 更 加 直观 生动 ， 免 去 那些 从 数据 引 警 上 和 存 取 数据 的 大 量 重复 的 数据 转换 过 
程 ， 那 样 吕 不 是 更 好 吗 ? 通过 图 形 数据 库 ， 我 们 得 以 实现 。 图 形 数据 库 使 用 图 形 模 型 将 数据 作为 图 形 存储 ， 图 形 数 据 库 由 顶点 和 
边 构 成 ， 顶 点 和 边 这 两 个 图 形 可 以 构建 任何 的 图 形 。 


此 外 ， 具 有 您 久 历 史 的 图 论 中 的 所 有 算法 都 可 以 在 图 形 数据 库 中 使 用 ， 以 更 有 效 地 解决 与 图 形 有 关 的 问题 ， 在 查询 用 时 上 会 
比 关 系数 据 库 的 查询 用 时 更 少 。 


一 旦 你 读 了 本 书 ， 你 束 会 熟悉 Neo 和 ，Neo4D 是 目前 最 优秀 的 图 形 数 据 库 之 一 。 在 本 书 中 ， 你 将 了 解 图 形 数据 库 Neo 笑 如 何 
帮助 你 建 模 和 解决 图 形 问题 ， 即 使 在 大 数据 时 也 具有 更 优 展 的 运行 性 能 和 更 合理 的 方式 。 


1.1 为 什么 要 有 Neo4] 


为 什么 要 使 用 图 形 数据 库 呢 ?或 者 更 具体 地 说 ，Neo4D 是 你 的 数据 库 的 正确 选择 吗 ? 正如 前 面 所 提 到 的 ， 对 于 人 们 试图 使 用 
逻辑 的 方法 ， 并 用 类 似 于 图 形 的 结构 和 概念 对 他 们 特殊 问题 的 领域 进行 建 模 和 描述 那 是 很 自然 的 ， 尽 管 他 们 最 终 可 能 并 不 是 以 图 


型 数据 库存 储 数据 。 选 择 正确 的 数据 库 (或 者 是 在 存储 领域 中 已 有 的 多 种 语言 版 本 的 数据 库 中 选择 多 种 数据 库 ) 存储 数据 可 以 使 
应 用 程序 的 运行 速 厌 大 大 加 快 ， 正 像 如 果 选 钳 了 数据 库 融 会 使 程序 完全 衣 溃 一 样 。 


对 于 这 个 问题 可 以 使 用 一 个 例子 来 做 出 很 好 说 明 。 取 一 个 非常 适合 于 用 图 形 数据 库 解决 的 问题 ， 看 看 怎样 应 用 Neo 怕 解决 ， 
并 与 使 用 另 一 个 不 同 数 据 库 的 存储 做 出 对 比 。 为 了 便于 比较 ， 我 们 将 使 用 传统 的 关系 数据 库 作为 比较 对 象 ， 因 为 这 是 在 一 般 情 况 
下 大 多 数 人 涉及 的 存储 对 比 的 选择 。 更 重要 的 是 ， 这 也 是 大 多 数 人 在 目前 ， 也 可 能 以 后 仍然 会 在 解决 问题 时 选择 的 关系 数据 库 模 


型 。 


我 们 要 探讨 的 例子 是 一 个 社交 网 络 ， 一 组 可 能 相互 乙 间 是 朋友 的 用 户 。 图 1-1 显 示 了 该 社交 网 络 ， 用 箭头 连接 的 用 户 之 间 是 
朋友 关系。 


四 注意 


要 使 语义 正确 ， 朋 友 的 关系 应 该 是 双向 的 。 在 Neogj 中 ， 双 向 性 是 使 用 两 个 关系 建立 的 ， 以 每 一 个 关系 建立 一 个 方向 (在 
Neo4j 中， 每 个 关系 必须 要 明确 定义 一 个 方向 ， 但 以 后 会 定义 多 个 方向 ) 。 因 此 ， 你 应 该 会 看 到 每 对 朋友 之 间 都 有 两 个 独立 的 朋 
友 关 系 ， 在 每 个 方向 上 有 一 个 关系 。 为 简单 起 见 ， 我 们 建立 了 单 向 直接 的 朋友 关系 。 在 第 2 章 和 第 3 章 中 你 将 会 了 解 为 什么 这 种 数 


据 模型 在 Neo4j 中 实际 上 是 非常 高 效 的 。 


让 我 们 来 看 看 天 系数 据 库 如 何人 存储 用 户 及 他 们 的 朋友 。 


1.2 关系 数据 库 中 的 图 形 数 据 


在 天 系数 据 库 中 ， 通 单 使 用 两 个 具有 关系 的 表格 仓储 社交 网 络 的 数据 : 一 个 用 于 仔 储 用 户 信息 ， 而 另 一 个 用 于 仓储 用 户 之 间 
的 天 系 (参见 图 1-2) 。 


关系 数据 库 中 的 图 形 数据 


" 
有 ils FRIEND OF 于 三 


\ ~ FRIEND QF : “lS FRIEND OF 


IS FRIEND OF 


~ IS FRIEND OF 


IS FRIEND OF 


IS FRIEND OF 


IS FRIEND OF 


1 


图 1-1 以 图 形 数据 结构 描述 的 用 户 与 他 们 的 朋友 


id name 加 user 1 USer 2 
| Joln $ 1000 | 2 
2 Kate H 1001 3 3 
3 Aleksa V 1002 | ] 
4 JackT 1003 6 2 
5 Jonas P 1004 4 3 
5 AnneP 1005 I 和 


图 1-2 ”描述 用 户 及 其 朋友 数据 的 SQL 图 表 


程序 1-1 显 示 了 在 MySQL 数 据 库 中 用 SQL 脚本 语言 创建 的 表 。 


【程序 1-1】 SQL 脚本 语言 定义 的 社交 网 络 数据 表 


create table t user | ce | 
i ] 定义 在 慷 用 户 信 息 吕 
1d bligint nct null., | 定义 存储 用 信息 索 


name varchar 【2551 not null, 
primary key (id) 
1 ; 
create table t user friend | | 定义 存 桩 朋友 关系 夷 
i bigint not null, 
user 1 bigint net null, 
user 2 bigint nct null., 
primary key (id) 


| 
| 


alter table t+t user iriend 
add index FRK416055ABCO132571 (USer 1), 
add conastraint FR41605S5SABCSE132571 
foreign key {user 1) references t user (lid); , 外 键 幼 束 
alter table t user friend 
add index FK41605S5ABC6132572 (USe 
add constraint FE41605S5ABC6132572 
foreign key (user 2) references 七 


= a 


“USer lid); 


表 t_user 包 含 看 用 户 信 息 的 询 ， 而 表 t_user friend 只 有 两 刚 ， 用 外 键 天 系 引 用 表 t_user。 主 键 和 外 键 具有 索引 ， 以 便 进行 快 
速 查 找 操作 。 索 引 是 关系 数据 库 中 使 用 的 典型 查找 技术 。 


使 用 MySQL 查 询 图 形 数 据 


你 会 如 何 去 查 询 一 个 关系 数据 库 呢 ? 获取 一 个 特定 用 户 的 直接 朋友 数 是 相当 简单 的 。 如 下 的 基本 select 查 询 就 可 以 实现 这 一 
目的 : 


select count (distinct uf.*} from t vser friend uf Where uf .user 1 = ?了 
曲 注 间 

我 们 在 所 有 的 例子 中 计算 所 有 的 朋友 数量 ， 因 此 ， 不 能 通过 加 载 实 际 的 数据 而 使 CPU 或 内 存 超载 。 

如 何 找 到 一 个 用 户 的 朋友 的 所 有 朋友 ? 通 弟 ， 在 僵 询 前 ， 典 型 的 做 法 是 将 表 t_user friend 与 它 目 身 联接 起 来 。 

select count (distinct uf2.*) from t user friend 二 


inner Join 七 user friend uf2 on ufl .user 1 = uf2 .user 2 
where ufl :user 1 = 了 


流行 的 社交 网 络 通 弟 具 有 从 你 的 具有 一 定 分 离 度 或 深度 的 朋友 圈 推 荐 潜在 的 朋友 或 联系 人 的 功能 。 如 果 你 想 做 某 一 些 相似 的 
事情 以 寻找 某 一 个 用 尸 的 朋友 的 朋友 的 朋友 ， 你 仅仅 需要 另外 的 一 个 join 操 作 。 


select count ldistinct uf3.*) from 七 user friend wfl1 


nner Join 七 user friend uf2 on ufl.user 1 = Uf2 .USBEer 2 
inner Join t user friend uft3 on uf2 .user 1 = uf3.uBer 2 


三 和 =- Ul] .Se ] 二 


同样 ， 要 做 一 个 四 层 天 系 的 循环 ， 融 需要 四 个 join 操作 。 要 获得 著名 的 入 度 分 离 问 题 的 所 有 连接 ， 将 需要 6 个 join 操作 。 


对 于 这 种 做 法 ， 没 有 什么 不 正音 的 ， 但 是 有 一 个 潜在 的 问题 : 尽管 你 只 关心 单一 用 户 的 朋友 的 朋友 ， 但 你 必须 对 表 
t_user friend 中 的 所 有 数据 做 一 个 join 操作 ， 然 后 丢弃 你 不 再 感 兴趣 的 所 有 行 。 对 于 一 个 小 的 数据 集 ， 这 将 不 会 是 一 个 大 的 问 
题 。 但 是 ， 如 果 这 个 社交 网 络 不 断 上 友 展 壮大 ， 你 可 能 开始 遇 到 一 毕 严 重 的 性 能 问题 。 正 如 你 将 看 到 的 ， 这 将 会 给 天 系 型 数据 引擎 
市 来 巨大 的 压力 。 


为 了 说 明 这 种 查询 的 性 能 ， 在 一 个 具有 1000 个 用 户 的 小 数据 集 上 运行 几 次 朋友 的 朋友 查询 ， 并 在 每 次 调用 和 记录 每 次 的 碍 
询 结果 的 同时 ， 增 加 搜索 的 深度 。 在 一 个 具有 1000 用 户 的 小 数据 集中 ， 平 均 每 一 个 用 户 具 有 50 个 朋友 。 表 t_user 包 含 了 1000 条 
记录 ， 而 表 {t user friend 包 含 了 1000x50=50000 条 记录 。 


在 每 个 深度 上 运行 了 10 次 得 询 ， 这 仅仅 是 在 任何 情况 下 都 能 帮助 提高 性 能 的 一 个 开始 ， 记 录 下 在 每 一 深度 上 的 最 快运 行 时 
间 。 除 在 程序 1-1 中 用 SQL 脚 本 语言 对 数据 库 的 列 定 义 达 引 外 ， 不 对 数据 库 进行 其 他 的 性 能 调整 。 表 1-1 给 出 了 实验 的 结 


表 1-1 使 用 MySQL 数 据 库 引擎 对 一 个 有 1000 个 用 户 的 数据 库 使 用 多 个 join 查 询 的 运行 时 间 


深 查询 1000 个 用 尸 的 运行 时 间 (种 ) 计数 结果 


| | ba 


| 


全 注意 

所 有 的 实验 均 在 Ihtel i7-CPU、8GB 内 存 的 商用 笔记 本 电脑 上 完成 ， 本 书 的 写作 也 是 在 这 台 笔 记 本 电脑 上 完成 的 。 
名 注意 

在 深度 为 3、4、5 时 均 返 回 数值 999， 这 是 由 于 数据 集 太 小 ， 数 据 库 中 的 每 一 个 用 户 都 相互 关联 着 。 


J 正如 你 能 够 看 到 的 ，MySQL 处 理 查 询 的 深度 为 2 和 3 时 ， 其 表现 相当 不 错 。 关 系数 据 库 的 join 操 作 并 非 不 常见 ， 而 是 很 通 当 
的 操作 。 因 此 很 多 数据 库 引 警 都 把 这 种 操作 作为 默认 的 设计 。 使 用 数据 库 相 关 列 上 的 率 引 也 能 帮助 天 系数 据 库 最 大 化 其 执行 join 
查询 操作 的 性 能 。 


然而 ， 在 深度 为 4 和 5 时 ， 性 能 显著 下 降 : 涉及 深度 4 的 查询 需要 10 秒 以 上 才能 完成 ， 而 在 深度 ?5 时 ， 尽 管 计 数 结果 没有 改 
变 ， 但 执行 的 时 间 束 更 长 了 ， 超 过 了 一 分 半 钟 。 这 说 明了 当 处 理 图 形 数据 时 MySQL 所 受到 的 限制 : 深度 图 形 需 要 多 个 join 操作 
时 ， 关 系数 据 库 通常 表现 得 不 太 好 。 
SQL 的 join 操 作 的 低 效 率 性 
要 在 深度 5 查找 一 个 用 户 的 所 有 朋友 ， 关 系数 据 库 引 敬 需要 产生 t_user friend 表 的 笛 卡 儿 积 五 次 。 对 于 一 个 拥有 50000 个 记录 


的 表 ， 所 得 到 的 数据 集 将 有 500005 行 (102.4X10?1) ， 这 需要 相当 长 的 时 间 和 计算 能 力 来 做 出 这 些 计 算 。 最 后 只 返回 了 你 感 兴趣 


的 不 到 1000 条 的 记录 ， 而 放弃 了 超过 99% 的 计算 结果 ! 


正如 你 所 看 到 的 ， 天 系数 据 库 并 不 擅长 多 对 多 天 系 的 数据 模型， 尤其 是 在 大 型 数据 集 时 。 而 相反 ，Neo4 正 好 擅长 多 对 多 的 
天 系 ， 因 此 ， 让 我 们 来 看 看 Neo4j 是 如 何 使 用 相同 的 数据 集 来 实现 的 。 不 是 使 用 表 、 人 列 和 外 键 ， 而 是 通过 将 用 户 作为 节点 、 朋 友 
天 系 作为 节点 之 间 的 关系 来 建立 模型 的 。 


1.3 ”Neo4j 中 的 图 形 数 据 


Neo4j 将 数据 作为 项 点 和 边 存 储 (或 者 用 Neo 笑 术语 ， 节 点 和 关系 存储 ) 。 用 户 被 定义 为 节点 ， 朋 友 天 系 代表 用 尸 节操 之 间 
的 关系 。 如 果 回顾 图 1-1 的 社交 网 络 ， 你 会 友 现 它 无 非 束 是 一 张 图 ， 以 用 尸 作为 书 点 和 朋友 关系 箭头 作为 天 系 。 


关系 数据 库 和 Neo4j 图 形 数据 库 的 重要 区 别 是 数据 查询 。 在 Neo4j 图 形 数据 库 中 ， 没 有 表 和 列 的 概念 ， 也 没有 基于 SQL 的 
select 和 join 命令 。 那 么 Neo4j 如 何 查询 图 形 数据 库 呢 ? 


答案 并 不 是 “ 写 一 个 分 布 式 的 MapReduce 函 数 ”。 像 所 有 的 图 形 数据 库 一 样 ，Neo 活 借用 图 论 的 强大 数学 概念 ， 并 作为 一 
个 强大 和 高 效率 的 引 警 用 于 查询 数据 。 这 个 概念 束 是 图 形声 万， 图 形声 历 是 使 Neo4 具 有 强大 处 理 大 型 图 形 数据 的 主要 工具 之 


图 形 数 据 遍 历 


饥 历 是 在 图 形 数据 库 中 人 在 由 关系 连接 的 节点 之 间 移 动 访问 一 组 节点 的 操作 。 它 是 图 形 数据 库 数据 检索 的 一 个 基本 操作 ， 
此 ， 它 也 是 图 形 模型 中 所 特有 的 。 遍 历 的 重要 概念 是 其 本 身 的 局 域 化 ， 遍 历 查询 数据 时 仪 仪 用 到 所 必需 的 数据 ， 而 不 需要 像 在 关 
系数 据 库 中 使 用 oin 操 作 那 样 对 所 有 的 数据 集 实 施 代价 昂贵 的 分 组 操作 。 


Neo4j 提 供 了 丰富 的 遍历 应 用 程序 接口 (API) ， 可 以 用 于 在 图 形 数据 库 中 漫游 。 此 外 ， 还 可 以 使 用 REST API 或 Neo4j 的 碍 
询 语 言 人 毅 历 数据 。 本 书 将 以 大 量 的 篇 幅 来 讲解 基本 原理 和 和 Neo 遍历 数据 的 最 佳 实践 。 


要 得 到 一 个 用 尸 的 所 有 朋友 ， 运 行程 序 1-2 中 的 代码 。 
【程序 1-2】 ”Neo4D 在 深度 2 查询 用 尸 所 有 朋友 的 壳 历 API 代 码 


TraversalDescription traversalDescription = 
Traversal .descriptiont) 
.relationships ("IS FRIEND OF", Drection .OUTGOING) 
.evaluatorlEvaluators.atDepth (2)) 
niqueness {Unligqgueness .NODE GLOBAL).; 
Iterable<Node> nodes = traversalDescription.traverse (nodeById) .nodes'().; 


如 果 你 不 理解 程序 1-2 中 的 代码 也 不 必 着 急 ， 所 有 的 内 容 都 会 在 后 续 的 章节 中 慢 慢 地 做 出 透彻 的 讲解 。 图 1-3 是 基于 前 面 对 
饥 历 的 搞 述 给 出 的 这 个 社交 网 站 的 图 形 志 历 图 示 。 


“IS FRIEND OF 
bs 


IS FRIEND OF 


TS FRIEND OF TJs FRIEND OF 


图 1-3 ”社交 网 络 图 形 数 据 库 的 遍历 


在 遍历 开始 前 ， 首 先 选 择 饥 历 开始 的 节操 (图 1-3 中 的 节点 X) 。 然 后 跟随 所 有 的 朋友 关系 (箭头 ) 并 收集 访问 过 的 节点 作 
为 结果 。 亿 历 继续 通过 连接 它们 的 关系 从 一 个 节点 走 到 另 一 个 节点 。 关 系 的 万 向 并 不 影响 遍历 ， 你 可 以 沿 着 箭头 的 方 同 往 上 或 者 
往 下 ， 其 效率 是 相同 的 。 当 不 符合 规则 时 ， 则 停止 遍历 。 例 如 ， 规 则 可 能 是 从 开始 的 书 点 只 访问 深度 1 的 节点 ， 在 这 种 情况 下 ， 
一 旦 深度 1 上 的 所 有 书后 都 访问 完 ， 亿 历 束 停 止 (图 1-3 中 的 黑 箭头 表示 本 例子 所 跟随 的 天 系 ) 。 


表 1-2 给 出 了 在 图 形 数据 库 中 运行 退 历 的 性 能 指标 ， 该 图 形 数据 库 中 的 数据 与 前 面 的 MySQL 数 据 库 中 的 数据 相同 〈 这 里 遍历 
的 功能 与 前 面 的 数据 查询 功能 相同 ， 在 给 定 的 深度 查询 用 尸 朋 友 的 朋友 ) 。 这 里 再 次 使 用 的 是 一 个 1000 个 用 户 的 数据 集 ， 平 均 
每 个 用 户 有 50 个 朋友 。 


表 1-2 Neo4j 对 一 个 有 1000 个 用 户 的 图 形 数 据 库 遍 历 的 运行 时 间 


深 度 查询 1000 个 用 户 的 运行 时 间 (种 |) 计数 结果 


四 注意 


类 似 于 MySQL 的 设置 ， 不 需要 对 Neo4j 的 例子 进行 额外 的 性 能 优化 。Neo4j 是 在 谱 入 式 并 以 默认 配置 在 2048MB 的 Java 庶 拟 机 


(JVM) 堆 内 存 下 运行 的 。 


需要 注意 的 首要 事情 是 ， 除 了 最 简单 的 一 种 吾 询 外 ， 对 其 他 所 有 得 询 ，Neo4j 表 现 得 都 非 曲 出 色 。 只 有 当 得 询 朋 友 的 朋友 
(在 深度 2) 时 ，MysQL 的 表现 才能 与 Neo4j 的 损 历 相 媲 美 。 在 深度 3 的 所 历 查 询 中 ， 朋 友 比 MySQL 快 四 倍 。 当 企 深 度 4 进行 志 
历 操作 时 ， 其 对 比 结果 高 了 五 个 数量 级 。 在 深度 5，Neo4j 的 遍历 查询 速度 要 比 MySQL 的 查询 快 上 干 万 倍 。 


从 表 1-2 可 以 得 出 另外 一 个 结论 ， 随 着 亿 历 深度 的 变化 ， 当 返回 的 节操 数 保持 不 变 时 ， 查 询 性 能 仪 有 轻微 的 降低 。 而 MySQL 
的 查询 性 能 随 着 查询 深度 的 变化 而 下 降 ， 这 是 因为 所 做 的 苗 卡 儿 积 的 大 部 分 都 锐 丢 人 草 。Neo4 笑 跟踪 记录 访问 过 的 古 点 ， 于 是 可 以 
跳 过 之 前 访问 过 的 节点 ， 因 此 查询 性 能 显著 提高 。 


为 了 查询 深度 5 的 所 有 关系 ，MySQL 将 对 t_user friend 表 执行 笛 卡 儿 积 运算 5 次 ， 那 将 产生 50000? 个 记录 ， 其 中 只 有 1000 
个 是 有 用 的 ， 其 他 的 都 被 丢弃 。Neo 活 则 只 访问 数据 库 中 的 节点 ， 当 没有 更 多 的 节点 可 访问 时 ， 它 将 停止 帝 历 。 这 就 是 为 什么 


Neo4j 可 以 在 返回 的 节点 数目 保持 不 变 的 情况 下 保持 稳定 的 性 能 ， 而 使 用 MySQL 的 查询 将 有 明显 的 性 能 下 降 。 
全 注意 


图 形 人 遍历 明显 优 于 等 效 的 MySQL 查 询 (在 深度 4 和 深度 5 的 遍历 优 于 等 效 的 MySQL 查 询 上 千 倍 ) 。 与 此 同时 ， 遍 历 性 能 不 会 
随 深度 明显 降低 ， 在 深度 5 的 遍历 仅仅 比 深度 2 的 遍历 慢 0.03 秒 。 对 于 最 复杂 的 MySQL 查 询 的 性 能 要 比 简单 的 查询 慢 10000 倍 以 
上 。 


但 是 ， 当 直到 大 数据 时 ， 这 种 图 形声 历 的 表现 如 何 ? 为 了 得 到 答案 ,让 我 们 以 一 个 拥有 100 万 用 尸 的 数据 集 作为 实例 。 


14 ”大 妆 嘱 下 的 SQL 联 接 操 作 己 Neo 生 图 形声 历 的 对 比 


对 于 这 个 实验 ， 我 们 严格 地 使 用 与 以 前 相同 的 数据 结构 ， 唯 一 的 差别 是 数据 的 数量 。 


在 MySQL 的 s_user 表 中 ， 有 1000000 条 记录 ， 而 在 t_user friend 表 中 ， 大 约 有 1000000x50= 50000000 条 记录 。 针 对 该 数 
据 集 ， 我 们 执行 四 个 相同 的 查询 语句 (在 深度 2、3、4 和 5 的 关系 ) 。 表 1-3 给 出 了 在 这 种 情况 下 所 得 到 的 SQL 查 询 的 性 能 参数 。 


表 1-3 使 用 MySQL 数 据 库 引擎 对 一 个 有 100 万 个 用 户 的 数据 集 进 行 多 重 join 查 询 的 执行 时 间 


深 上 度 查询 100 万 个 用 尸 的 运行 时 间 ( 秒 ) 计数 纺 果 


bs 


~000 000 


没有 完成 a 


| 


把 这 些 结果 与 MySQL 对 1000 个 用 尸 的 数据 集 的 查询 结果 相 比 较 ， 你 可 以 看 人 到， 深度 2 的 查询 性 能 基本 保持 不 变 ， 这 可 以 通 
过 MySQL3 引 | 擎 有 效 地 使 用 索引 对 表 的 join 查 询 进 行 处 理 来 做 解释 。 在 深度 3 和 4 (其 中 分 别 使 用 3 个 和 4 个 join 操 作 ) 时 ， 其 结 
郑 很 多 ， 至 少 有 两 个 数量 级 的 差别 。 对 于 深度 5 的 所 有 关系 ， 在 运行 本 段 程 序 代 码 的 一 个 小 时 内 ，3SQL 没 有 完成 查询 。 


四 注意 


存储 这 些 例子 的 大 量 数据 ， 需 要 一 个 相当 大 的 磁盘 空间 。 要 生成 样本 数据 和 运行 这 些 例子 ， 需 要 超过 10GB 的 可 用 磁盘 空 
间 。 


这 些 结果 清楚 地 表明 ，MySQL 关 系数 据 库 只 对 单个 oin 查 询 进 行 了 优化 ， 即 使 在 大 数据 集 时 也 是 这 样 。 针 对 大 数据 集 时 ， 
其 多 重 Join 查 询 的 性 能 显 阁 下 降 ， 到 某 种 程度 上 ， 有 些 查 询 甚 至 不 能 完成 (例如 ， 在 一 个 具有 100 万 个 用 尸 的 数据 集中 查询 深度 5 
的 所 有 朋友 ) 。 


为 什么 天 系数 据 库 查询 这 么 慢 ? 
基于 join 操作 的 工作 方式 ， 表 1-3 的 结果 从 某 种 程度 上 是 可 以 预期 的 。 正 如 我 们 前 面 所 讨论 的 ， 每 一 个 join 操作 都 会 产生 所 有 
潜在 行 组 合 的 笛 卡 儿 积 ， 然 后 筛选 出 那些 与 whete 语 名 不 匹配 的 项 。 对 于 一 个 拥有 100 万 个 用 户 的 数据 集 ，5 个 join 操作 的 笛 卡 儿 积 
(相当 于 对 深度 5 的 查询 ) 列 含 着 巨大 数量 的 行 记 录 数 以 十 亿 计 。 这 里 没 用 太 多 的 零 以 便 阅 读 。 过 滤 挤 所 有 不 匹配 的 查询 结 
果 的 代价 是 巨大 的 ， 使 得 在 深度 5 的 SQL 查 询 在 一 个 合理 的 时 间 内 无 法 完成 。 


我 们 用 Neo 生 的 遍历 重复 了 同样 的 实验 。 用 100 万 个 节点 代表 用 尸 ， 并 有 大 约 5000 万 个 关系 存储 在 Neo4j 数 据 库 中 ， 同 前 面 
的 例子 一 样 ， 我 们 执行 了 同样 的 4 个 遍历 ， 得 到 的 运行 性 能 数据 如 表 1-4 所 示 。 


表 1-4 Neo4j 对 一 个 有 100 万 个 用 户 的 图 形 数 据 库 遍历 的 运行 时 间 


深 度 查询 100 万 个 用 户 的 运行 时 间 ( 秒 ) 计数 结果 
2 -2500 
4 -600 000 
> ~800 000 


正如 你 所 看 到 的 ， 数 据 量 成 干 倍 的 增加 并 没有 明显 影响 Neo 有 4 的 性 能 。 随 着 深度 的 增加 ， 志 历 确 实 变 慢 ， 但 最 主要 的 原因 是 
返回 结果 数量 的 增加 。 随 着 结果 数量 的 增加 ， 其 性 能 呈 线 性 减 慢 ， 在 数据 集 和 深度 都 增 大 的 情况 下 ， 这 也 是 可 以 预期 的 。 尽 管 如 
此 ， 这 也 至 少 比 MySQL 的 性 能 好 上 百倍 。 


Neo4j 性 能 的 可 预期 性 的 主要 原因 是 图 形 遍 历 的 局 部 性 ， 不 管 图 形 中 有 多 少 个 节点 和 关系 ， 根 据 遍 历 规 则 ， 远 历 将 仅仅 访问 
那些 连接 到 起 始 节 点 的 节点 。 请 记 住 ， 关 系数 据 库 的 join 操 作 计 算 笛 卡 儿 积 并 丢弃 不 相关 的 结果 ， 随 着 数据 集 的 增 大 ， 将 按 指数 
变化 影响 其 性 能 。 然 而 ，Neo 活 只 访问 与 遍历 相关 的 节点 ， 所 以 能 够 不 受 忌 数 据 集 大 小 的 影响 ， 从 而 保持 期 待 的 性 能 。 要 遍历 访 
问 的 节点 越 多 ， 遍 历 丈 会 越 慢 ， 正 如 当 增 加 深度 时 所 见 到 的 。 但 是 ， 这 种 变 慢 是 线性 的 ， 而 且 仍 然 不 受 忌 图 形 大 小 的 影响 。 

Neo4j 的 速度 秘密 在 哪里 ? 

并 不 是 Neo4j 的 开发 者 发 明了 一 种 超 高 速 的 算法 ， 也 不 是 基于 一 种 具有 魔幻 速度 的 技术 (其实 就 是 在 Java 中 实现 的 ) 。 

秘密 就 在 数据 结构 中 一 一 图 形 的 局 部 性 使 得 遍历 的 速度 非常 快 。 假 设 你 要 在 一 个 当地 的 小 足球 场 为 你 的 球 队 加 油 。 如 果 有 人 
问 你 坐 在 你 身边 15 英 尺 以 内 有 多 少 人 ， 你 会 站 起 来 ， 并 以 最 快 的 速度 数 一 数 你 身边 的 人 。 现 在 设想 你 在 国家 足球 场 看 比赛 ， 有 很 
多 观众 ， 你 要 回答 的 是 同一 个 问题 ， 即 在 你 15 英 尺 以 内 有 多 少 人 。 假 设 这 两 个 足球 场 的 人 数 密度 是 一 样 的 ， 那 你 会 有 大 致 相同 的 
人 数 需 要 数 ， 所 用 的 时 间 也 会 非常 接近 。 于 是 可 以 说 ， 不 管 足球 场 能 容纳 多 少 人 ， 你 将 以 预计 的 时 间 把 你 身边 的 人 数 完 ， 因 为 你 
只 需要 数 坐 在 你 身边 15 英 尺 以 内 的 人 ， 而 不 用 去 关心 在 球场 另 一 边 包 厢 里 的 人 。 


Neo4j 引 擎 正 像 本 例 一 样 工作 一 一 以 预期 的 速度 访问 与 起 始 节点 相连 的 节点 。 即 使 整个 图 形 的 节点 增加 (假设 节点 密度 一 
样 ) ， 性 能 仍然 可 以 保持 预期 的 速度 。 


如 果 对 关系 数据 库 的 查询 采用 同样 的 足球 比赛 类 比 ， 那 你 需要 数 一 数 所 有 在 球场 的 人 数 ， 然 后 删 去 那些 不 在 你 身边 的 人 ， 这 
可 不 是 给 出 相互 关联 数据 的 最 有 效 方法 。 


这 些 实验 证 明了 Neo4j 图 形 数据 库 在 查询 图 数据 时 比 使 用 天 系数 据 库 的 速度 更 快 。 另 外 ， 一 个 Neo 志 实例 处 理 了 超过 三 个 数 


量 级 的 数据 集 而 不 使 其 性 能 降低 。 志 历 的 性 能 不 受 图 形 数据 大 小 的 影响 是 Neo4j 的 一 个 重要 特征 ， 这 使 得 Neo4j 成 为 解决 图 形 问 
题 的 理想 数据 库 ， 即 使 数据 集 非常 大 时 也 没有 问题 。 


在 接 下 来 的 章节 中 ， 我 们 将 尽量 回答 什么 是 图 形 数据 的 问题 ， 以 及 Neo 有 4 如 何 帮助 你 像 目 然 图 形 结构 一 样 建立 数据 模型 。 


1.5 图 形 


图 形 是 最 普遍 的 目 然 结 构 。1774 年 瑞士 数学 家 欧 拉 友 表 的 对 柯 尼 斯 堡 七 桥 问 题 的 解决 方案 被 称 为 图 论 的 第 一 篇 科学 论文 。 
七 桥 问 题 的 解决 代表 图 论 的 出 现 ， 现 在 ,图 论 的 模型 和 算法 已 经 被 广泛 地 应 用 于 多 个 科学 和 工程 领域 。 


现代 科学 中 有 许多 图 形 应 用 的 例子 。 例 如 ， 用 图 形 摘 述 化 学 化 合 物 中 的 原子 和 分 子 的 相对 位 置 ， 物 理学 中 原子 的 连接 规则 也 
用 图 形 描述 。 在 生物 学 中 ， 进 化 树 实 际 上 也 是 一 种 形式 的 图 形 。 在 语言 学 中 ， 用 图 形 建 模 来 换 述 语义 规则 和 语法 树 。 网 络 分析 、 
交通 建 模 应 用 、 电 信 通 信和 以 及 拓扑 应 用 都 基于 图 论 。 


在 计算 机 科学 中 ， 很 多 问题 以 图 形 建 模 : 社区 网 络 、 访 问 控制 列表、 网 络 拓扑 结构 、 分 类 层次 结构 和 推荐 引擎 等 。 传 统 上 ， 
所 有 这 些 问 题 都 将 使 用 图 形 对 象 模型 〈 由 开 友 团队 实现 ) ， 并 以 规 学 化 的 形式 作为 数据 仓储 在 一 组 以 外 键 相 关联 的 表 中 。 


在 前 面 的 章节 中 ， 我 们 已 经 看 到 了 如 何 将 一 个 社交 网 络 使 用 两 个 表 和 一 个 外 键 约束 存储 在 关系 模型 中 。 使 用 Neo4j 图 形 数据 
库 ， 你 可 以 保存 数据 的 自然 图 形 结构 ， 而 不 会 影响 性 能 或 存储 空间 ， 因 此 极 大 地 提高 了 查询 的 性 能 . 


当 使 用 Neo4j 图 形 数据 库 解 决 图 形 问 题 时 ， 开 久 者 的 工作 量 将 会 碱 少 ， 因 为 图 形 数 据 库 的 API 中 已 经 有 了 图 形 结构 。 数 据 以 
图 形 节 点 和 天 系 的 目 然 形式 仓储 ， 所 以 ， 对 象 天 系 不 匹配 的 情况 很 少 友 生 。 使 用 Neo4j 的 所 历 API 可 以 使 图 形 查 询 操作 以 高 效率 
和 高 性 能 的 方式 完成 。 在 本 书 中 ， 我 们 将 演示 Neo4j 在 解决 诸如 访问 控制 询 表 和 使 用 推荐 引擎 的 社交 网 络 等 问题 的 强大 功能 。 


如 果 你 不 熟悉 图 论 ， 也 不 必 担 心 。 我 们 将 在 后 面相 关 的 章节 中 介绍 一 些 图 论 的 概念 和 算法 ， 以 及 它们 对 图 形 存 储 引 掌 如 
Neo4j 的 适应 性 。 


在 接 下 来 的 章节 中 ， 我 们 将 讨论 为 什么 图 形 数据 库 (以 及 其 他 的 NosQL 技 术 ) 开始 在 计算 机 行业 中 普及 。 我 们 还 将 讨论 
NoSQL 系 统 的 分 类 ， 并 把 重点 放 在 它们 的 区 别 和 适用 性 上 。 


1.6 ”Neo4j 在 NoSQL 领 域 的 地 位 
自从 有 了 计算 机 软件 ， 应 用 程序 需要 处 理 的 数据 的 复杂 性 大 大 增加 。 数 据 的 复杂 性 不 仪 包括 它 的 大 小 ， 还 包括 它 的 相互 关联 
性 ， 结 构 的 干 变 万 化 以 及 对 数据 的 同时 访问 。 


随 着 数据 在 这 些 方 面 的 变化 ， 人 们 已 经 认识 到 关系 数据 库 从 很 长 一 段 时 间 以 来 ， 尽 管 在 事实 上 已 经 成 为 了 数据 存储 的 标准 ， 
但 并 不 适合 于 解决 面 对 数据 复杂 性 日 益 剧 增 的 所 有 问题 。 于 是 ， 多 种 新 的 存储 技术 应 运 而 生 ， 其 共同 的 目标 束 是 解决 天 系数 据 库 
不 适合 解决 的 问题 。 所 有 这 些 新 的 存储 反 术 都 归于 NoSQL 麻 下。 


全 注意 


尽管 NoSQL 的 名 字 已 被 人 们 接受 ,但 这 并 没有 准确 反映 出 其 代表 的 意义 ， 反 而 给 人 们 以 错误 的 印象 ， 认 为 它 只 是 对 SQL 而 言 
的 一 个 概念 。 其 实 一 个 更 好 的 名 字 ， 非 关系 数据 库 可 能 更 适合 于 它 ， 因 为 关系 型 / 非 关 系 范式 是 讨论 的 主题 ， 而 SQL 只 是 关系 型 


技术 使 用 的 一 种 语 言 o 


NoSQL 的 诞生 意味 着 应 对 数据 的 变化 需要 新 的 技术 。Neo4 作 为 一 个 通用 的 图 形 数据 库 ， 只 是 NoSQL 家 族 中 的 一 员 ， 它 与 
其 他 许多 或 多 或 少 与 存储 技术 相关 的 成 员 一 样 。 


随 着 NoSQL 领 域 的 迅速 友 展 ， 它 已 变 得 越 来 越 流行 ， 并 且 具 有 了 很 多 不 同 的 解决 方案 和 技术 可 供 选 择 。 任 何 新 进入 NoSQL 
世界 的 人 ， 在 选择 技术 时 ， 都 会 面临 很 多 选择 。 这 束 是 为 什么 我 们 在 这 一 节 中 将 讲解 NoSQL 技 术 的 分 类 ， 并 重点 讲解 每 一 类 的 
适用 性 。 此 外 ， 我 们 还 将 解释 图 形 数据 库 的 地 位 和 Neo 有 4 在 NoSQL 领 域 中 的 地 位 。 


1.6.1 主键 值 存储 


主键 值 存储 代表 了 最 简单 ， 但 却 非常 强大 的 处 理 大 量 并 友 访 问 数 据 的 万 法 。 缓 存 是 一 种 典型 的 主键 值 技术 。 主 键 值 存储 允许 
使 用 非常 们 单 的 结构 存储 数据 ， 这 些 数 据 常 弟 在 内 存 中 ， 甚 至 在 高 并 友 环 境 下 的 高 速 访问 。 


这 些 数据 存储 在 一 个 巨大 的 哈 希 表 中 ， 由 主键 进行 访问 。 数 据 取 主 键 值 对 的 形式 ， 对 其 操作 大 都 局 限于 使 用 入 单 的 
put (write) 和 get (read) 操作 。 其 值 仅 支 持 简单 的 数据 结构 如 文本 或 二 进 制 内 容 ， 虽 然 一 些 较 新 的 主键 值 存储 支持 一 组 有 限 
的 复杂 数据 类 型 (例如 ，Redis 支 持 列表 和 映射 作为 值 ) 。 


主键 值 存储 是 最 简单 的 NoSQL 拉 术 。 所 有 其 他 的 NoSQL 类 别 都 建立 在 简单 性 、 高 性 能 和 可 扩展 性 的 主键 值 存储 技术 上 ， 以 
更 好 地 适合 一 些 特定 的 使 用 场所 。 


1.6.2 ” 列 族 存储 


分 布 式 主键 值 模 型 缩放 得 很 好 ， 但 是 ， 在 这 个 模型 中 ， 必 须 使 用 某 些 类 型 的 数据 结构 。 这 就 是 列 族 存 储 类 别 如何 进 入 到 
NoSQL 领 域 中 的 。 


列 族 存储 是 将 类 似 的 值 (或 列 ) 作为 一 组 一 起 仓储 在 同一 列 族 中 (例如 ， 用 户 数据 或 有 天 书籍 的 信息 ) 。 使 用 这 种 方法 ， 从 
一 个 单一 的 主键 值 存储 友 展 到 一 组 相关 值 的 存储 。 (可 以 把 列 族 中 存储 的 数据 看 作为 一 张 映射 图 ， 或 者 将 主键 值 存储 到 每 一 个 值 
都 是 另外 一 张 映射 图 的 地 方 。) 列 族 都 存在 一 个 单一 的 文件 中 ， 以 实现 更 好 的 读 取 和 写 入 相关 数据 的 性 能 。 这 种 方法 的 主要 目的 
是 实现 在 大 数据 时 的 高 性 能 和 高 可 用 性 。 所 以 一 点 也 不 奇怪 ， 这 个 领域 的 领先 技术 是 Google 的 BigTable 和 Cassandra， 最 初 都 
是 由 Facebook 开 发 的 。 


1.6.3 ”面向 文档 的 数据 库 


很 多 实际 问题 (如 内 容 管理 系统 、 用 户 注册 数据 以 及 CRM 数 据 ) 的 需求 看 上 去 像 一 个 文件 的 数据 结构 。 面 向 文档 的 数据 库 
正好 提供 了 这 样 的 一 个 地 万 ， 用 以 仓储 简单 的 ， 然 而 是 局 效 的 ， 无 以 构 的 文档 数据 。 本 文档 模型 中 使 用 的 数据 结构 ， 可 以 使 你 添 
加 目 包 含 的 文件 和 天 联 天 系 到 廊 文 档 的 数据 中 。 


你 可 以 将 面向 文档 数据 库 看 作 主 键 值 仓储 ， 这 里 的 值 融 是 一 个 文件 。 这 使 得 面向 文档 数据 库 更 容易 为 通用 软件 问题 建立 数据 
模型 ， 但 这 使 它 的 性 能 和 可 扩展 性 相 比 主键 值 和 列 族 存储 稍微 有 些 降低 。 内 置 于 存储 系统 的 对 象 模型 的 便利 通常 是 一 个 对 所 有 情 
况 很 好 的 权衡 ,但 不 包括 大 量 的 并 发 使 用 情况 (毕竟 我 们 大 多 数 人 并 不 想 再 创建 一 个 Google 或 者 一 个 Facebook) 。 


1.6.4 ”图 形 数 据 库 


图 形 数据 库 的 设计 遵从 以 下 的 观点 ， 即 开 友 人 员 单 音 在 他 们 的 应 用 程序 中 建立 图 形状 的 数据 结构 ， 但 仍然 将 数据 以 一 个 非 目 


然 的 方式 仓储 ， 或 者 是 在 表格 和 天 系数 据 库 的 列 中 ， 或 者 在 其 他 的 NoSQL 存 储 系统 中 。 正 如 我 们 之 前 所 提 到 的 ， 像 ACL 列 表 、 
社交 网 络 或 任何 类 型 的 网 络 问题 都 是 目 然 的 图 形 问 题 。 图 形 数据 模型 是 图 形 数据 库 的 核心 ， 最 终 能 够 将 代表 图 形 的 数据 作为 一 个 
直接 图 形 仓储 一 个 对 象 模型 。 


这 个 数据 模型 可 以 目 然 地 表达 许多 非常 复杂 的 软件 需求 ， 图 形 遍 历 查 询 的 效率 和 性 能 是 图 形 数 据 库 的 主要 优势 。 


1.6.5 ”与 NoSQL 类 数据 库 的 比较 


表 1-5 给 出 了 每 一 个 NoSQL 类 别 的 使 用 实例 及 所 代表 的 技术 。 


表 1-5 NoSQL 分 类 概要 


NoSQL 分 类 典型 的 应 用 案例 最 著名 的 技术 
组 存 mm 及 edis 
主键 值 存储 快速 读 取 访问 简单 域 = Memcached 
| 大 规模 并 发 系统 m Tokyo Cabinet 
| 加 Cassandra 
”大 规模 写 ) 
列 族 存储 / a ( 读 和 写 ) 四 Goople BigTable 
及 训 六 这 和 二 nm Apache HBase 
| 当 域 模型 是 一 个 自然 文件 这 是。 
面向 文档 数据 库 | em 使 用 自然 文件 数据 结构 简化 开发 we 
加 责 可 坟 展 系统 【 斥 和 党 在 主键 全 存储 和 列 族 存储 的 低层 次 上 ) 
( 续 ) 
NoSQL 分 类 典型 的 应 用 案例 最 著名 的 技术 
拥有 互联 的 数据 
| 能 够 日 然 的 用 节 扣 和 关系 表达 的 域 Neod4] 
图 形 数 据 库 | 社交 网 络 nm AlleoroGraph 
推荐 引擎 OrientDB 


访问 控制 列表 


到 目前 为 止 ， 在 本 章 中 你 已 经 看 到 了 使 用 Neo4j 有 效 解决 与 图 形 相关 的 问题 ， 以 及 如 何 将 音 见 的 实际 问题 以 目 然 的 图 形 模型 
建 模 的 例子 ， 并 了 解 了 在 广阔 的 NoSQL 领 域 中 图 形 数据 库 和 Neo4j 特 别 适 合 的 领域 。Neo4j 还 有 一 个 关键 的 、 其 他 NoSQL 存 储 
所 没有 的 特点 ， 那 束 是 Neo 笑 采用 了 企业 界 一 个 新 的 极其 重要 的 存储 技术 : 事务 行为 。 


1.7“Neo4j 具 有 与 ACID 兼容 的 数据 格式 


自从 NoSQL 技 术 开 始 流行 以 来 ， 事 务 管理 一 直 是 人 们 讨论 的 一 个 重点 话题 。 对 提高 性 能 和 可 扩展 性 的 事务 属性 的 权衡 一 直 
是 非 关系 型 技术 处 理 大 型 数据 的 通用 做 法 。 有 些 (例如 BigTable、Cassandra 和 CouchDB) 使 用 了 权衡 的 一 致 性 ， 人 允许 客户 在 
分 布 式 系统 (最终 一 致 性 ) 的 某 些 情况 下 读 取 陈旧 数据 。 在 注重 读 取 性 能 (例如 内 存 缓存 ) 的 主键 值 存储 中 ， 对 数据 的 持久 性 没 
有 大 高 的 要 求 。 同 样 ， 在 一 个 单一 操作 层面 的 原子 性 ， 一 个 单一 事务 中 没有 包含 对 多 个 数据 库 进 行 联 接 操 作 的 可 能 性 ， 这 残 是 典 
型 的 面向 文档 的 数据 库 。 


这 里 提 到 的 每 一 种 方法 都 是 在 某 一 种 特定 的 情况 下 (如 高 速 组 人 趣 、 高 速 数据 读 取 卷 、 遍 负载 和 并 友 访 问 ) 使 用 才 有 效 。 当 涉 


及 将 非 关 系数 据 库 引进 任何 企业 或 公司 环境 时 ， 缺 少 基于 事务 处 理 的 ACID 通 单 是 第 一 道门 槛 。 虽 然 事务 属性 是 在 很 久 以 前 为 天 
系数 据 库 设计 的 ， 但 事务 属性 仍然 在 很 多 实际 应 用 中 友 挥 看 重要 和 关键 的 作用 。 于 是 ，Neo4 采 取 了 不 同 的 万 法 。 


Neo4j 的 目标 是 成 为 一 个 图 形 数据 库 ， 并 把 重点 放 在 数据 库 上 。 这 意味 着 你 将 在 Neo4j 数 据 库 中 得 到 ACID 的 全 部 支持 : 


“ 原子 性 (A) 你 可 以 在 一 个 事务 中 包含 对 多 个 数据 库 的 操作 ， 并 确保 它们 都 是 在 原子 性 的 情况 下 执行 的 ， 如 果 其 中 有 


一 个 操作 发 生 问题 ， 则 整个 事务 将 全 部 回 滚 。 
.一致 性 (C) 一 一 当 向 Neo4j 数 据 库 中 写 数据 时 ， 你 必须 保证 随后 访问 数据 库 的 每 个 用 户 读 取 的 都 是 最 近 、 更 新 的 数据 。 


也 离 性 (I) 一 一 必须 确保 一 个 单一 事务 中 的 操作 与 另外 的 事务 中 的 操作 是 隔离 的 ， 因 此 ， 一 个 事务 中 的 写 操作 不 会 影响 
另 一 个 事务 中 的 读 操 作 。 


持久 性 (D) 一 一 必须 确保 写 入 到 Neo4j 数 据 库 中 的 数据 保存 到 磁盘 ， 以 便 数据 库 重 新 启动 或 服务 器 前 溃 后 仍然 可 以 获取 


写 入 的 数据 。 
四 注意 


了 解 Neo4j 是 一 个 事务 数据 库 是 很 重要 的 ， 你 知道 的 在 关系 数据 库 中 关于 事务 的 一 切 都 适应 于 Neo4j。 我 们 前 面 提 到 的 事务 支 
持 是 Neo4j 与 其 他 NoSQL 数 据 库 之 间 的 主要 区 别 ，NoSQL 数 据 库 不 支持 所 有 的 ACID 属性 。 


对 任何 使 用 关系 数据 库 提供 的 担保 并 通过 ACID 事 务 支 持 可 以 确保 无 颖 地 过 渡 到 Neo4，ACID 事 务 支 持 也 提供 了 安全 和 方便 
的 图 形 数据 工作 方式 。 事 务 文 持 是 Neo 有 4 的 一 个 重要 特点 ， 这 是 它 与 其 他 NoSQL 数 据 库 解决 方案 的 区 别 乙 一 。 这 不 仅 对 NosQL 
的 爱好 者 ， 束 是 对 企业 用 尸 也 是 一 个 很 好 的 选择 。 


1.8 ”本章 小 结 
通过 本 章 的 学 习 ， 我 们 知道 了 相对 于 关系 数据 库 ，Neo4j 在 处 理 一 些 特 殊 问 题 时 更 加 有 效 ， 性 能 更 加 优越 ， 例 如 在 社交 网 络 
实例 中 。 我 们 以 Neo4j 为 例 ， 说 明了 图 形 数据 库 在 处 理 与 图 形 相 关 的 问题 时 相对 于 关系 数据 库 的 性 能 和 可 扩展 性 的 明显 优势 。 
我 们 也 了 解 了 一 些 Neo4j 的 主要 特点 ， 以 及 其 在 与 数据 存储 技术 相关 的 NoSQL 庞 大 队伍 中 的 地 位 。 


使 用 图 形 数 据 库 存储 数据 会 影响 到 你 对 数据 的 原 有 思维 方式 ， 这 是 因为 数据 建 模 变 得 非常 重要 。 图 形 数据 库 中 没有 关系 数据 
库 中 的 表 和 列 ， 也 没有 其 他 NoSQL 技 术 中 的 键 和 值 。 你 必须 将 思维 转换 为 以 图 形 代表 数据 上 。 在 下 一 章 中 ， 我 们 将 给 你 一 些 对 
图 形 数 据 建 模 的 最 佳 实践 指导 和 讲解 。 


第 2 章 ”Neo4j 的 数据 模型 


本 章 包 括 以 下 内 容 : 
` 为 什么 Neo4j 需 要 一 个 数据 模型 


` 领域 建 模 


“ 探索 其 他 的 领域 


在 本 章 中 ， 我 们 将 讨论 如 何以 及 为 什么 要 在 Neo 有 4 中 为 数据 建 模 ， 并 讨论 图 形 数据 库 中 的 建 模 方 法 。 先 让 我 们 看 看 对 给 定 领 
域 建 模 的 另 一 种 方法 ， 即 以 不 同 的 方式 利用 节点 、 关 系 、 属 性 和 标签 建 模 。 我 们 还 将 给 出 几 个 来 目 不 同 领 域 的 例子 以 展示 Neo4j 
数据 建 模 的 灵活 性 。 


我 们 来 看 看 用 Cypher 查 询 语言 写 的 查询 语句 。 这 纯粹 是 为 演示 ， 让 你 了 解 查询 这 里 给 出 的 模型 是 多 么 的 简单 。 你 不 需要 了 
解 Cypher 就 可 以 开始 给 数据 建 模 ， 后 面 将 对 Cypher 查 询 语言 做 详细 的 介绍 。 


2.1 Neo4j 中 数据 模型 的 类 型 


不 同 于 传统 的 关系 数据 库 管 理 系统 (Relational Database Management System，RDBMS) ，Neo4j 是 一 个 无 架构 数据 
库 。 在 开始 添加 数据 之 前 ， 你 并 不 需要 定义 表 和 关系 。 一 个 节点 可 以 具有 你 喜欢 的 任何 属性 ， 任 何 节 点 都 可 以 与 其 他 任何 节点 建 
立 关 系 。Neo4j 数 据 库 中 的 数据 模型 隐 合 在 它 存 储 的 数据 中 ， 而 不 是 明确 地 将 数据 模型 定义 为 数据 库 本 身 的 一 个 部 分 。 它 是 对 你 
想 要 仔 入 数据 库 的 数据 的 一 个 摘 述 ， 而 不 是 数据 库 的 一 系列 方法 来 限制 将 要 仓储 的 内 容 。 


由 于 Neo4j 的 数据 建 模 是 摘 述 性 的 ， 而 不 是 规定 性 的 ， 因 此 可 以 很 容易 对 数据 库 将 要 仓 储 的 数据 进行 一 致 性 的 描述， 这样 束 
可 以 以 期 己 的 万 了 式 构 以 查询 ， 并 以 相似 的 方式 来 摘 述 相似 的 实体 。Neo4j 的 理 询 语言 Cypher， 以 数据 模式 匹配 的 方式 工作 ， 
此 ， 将 数据 模型 看 作 一 个 基本 模式 的 库存 列表 就 是 一 种 方法 ， 例 如 : 


“ 一 个 人 的 居住 地 址 。 
` 地 铁 线 路 中 的 一 个 地 铁 站 与 另 一 个 地 铁 站 的 连接 。 
` 智能 电话 套餐 包含 了 一 部 智能 电话 和 话费 套餐 。 
这 些 模式 适合 于 以 下 实际 场景 : 
Peter 住 在 Gables，Mary 住 在 Acacia 大 街 13 号 。 
` 银行 站 点 连接 Moorgate 站 点 ， 银 行 站 点 和 Moorgate 站 点 都 连 在 西北 线路 上 。 
` 话费 较 少 的 用 户 套 餐 包 括 一 部 FictoPhone 智 能 手机 和 每 月 150 分 钟 的 移动 对 移动 免费 通话 。 


一 旦 你 对 将 要 仓储 在 数据 库 中 的 数据 进行 了 一 致 性 摘 述 ， 你 残 可 以 在 以 后 使 用 该 摘 述 来 对 将 要 仓 入 数据 库 的 数据 的 查询 进行 
推理 。 


表达 这 种 手 述 的 一 种 常见 万 法 是 图 表 。 通 过 绘制 表示 数据 的 常用 图 形 模式 图 ， 你 就 可 以 以 直观 的 方式 看 到 你 的 数据 。 在 
Neo42 的 早期 数据 建 模 阶段 ， 笔 和 日 板 、 一 张 纸 或 餐巾 纸 往 往 是 你 需要 开始 讨论 的 数据 样子 。 


2.1.1 图 表 建 模 的 一 个 简单 实例 


假设 人 与 人 之 间 并 不 是 一 种 朋友 的 关系， 而 你 感 兴趣 的 是 人 群 之 间 的 关联 模型 。 一 个 组 可 能 包含 几 个 人 ， 并 且 一 个 人 也 可 能 
属于 多 个 组 。 在 传统 的 关系 数据 库 中 ， 通 常会 使 用 三 个 表 的 模型 表达 这 种 情景 : 一 个 人 员 表 、 一 个 组 表 和 一 个 用 于 连接 人 和 组 的 
多 对 多 天 系 链接 表 ， 如 图 2-1 所 示 。 


图 2-1 关系 数据 库 中 用 链接 表 连 接 的 用 户 和 组 


在 Neo4j 中 ， 你 可 以 将 用 户 和 组 以 同样 的 模型 描述 为 节点 ， 将 组 成 员 描述 为 节点 之 间 的 关系 ， 如 图 2-2 所 示 . 


Delongs to 


2 


在 这 里 你 大 致 可 以 看 到 节点 是 图 形 数据 库 的 数据 模型 实体 (与 RDBMS 的 术语 对 应 ) ， 而 关系 勿 庸 置疑 是 节点 之 间 的 关系 或 
连接 。 用 纯 语言 表达 这 个 图 表 的 天 系 束 是 “一 个 人 属于 一 个 组 ”。 


让 我 们 看 看 有 几 个 人 和 几 个 组 的 情况 会 是 如 图 2-3 所 示 的 样子 。 


belongs to 


belongs to belongs to 


es 


同 球 俱 乐 yp 
a 


板 球 但 乐 部 


图 2-3 ”两 个 组 中 的 三 个 人 
图 2-2 所 示 的 模式 出 现在 图 2-3 的 几 个 地 方 。 事 实 上 ， 整 个 图 2-3 可 以 通过 苹 加 几 次 图 2-2 得 到 |。 
当 查 询 这 个 模型 中 的 数据 时 ， 可 能 有 两 个 问题 需要 回答 。 首 先 ， 对 于 一 个 给 定 的 人 ， 这 个 人 属于 哪个 组 ? 第 二 ， 对 于 一 个 给 
定 的 组 ， 哪 些 人 属于 这 个 组 ”使 用 Neo4j 的 查询 语言 Cypher 很 容易 实现 。 


一 a cn - x a i— 一 二 一 -- 3 
对 五 和 总 ， 井 且 已 书 扣 有 韦 罕 IFenme 


匹配 所 有 的 了 和 gg 之 间 有 属于 (belongs_to) 关系 的 节操 
MATCH {p}-[:belongs to] ->{9g) | 


WHERSE pp.nane = “JFENe” 

RETURN g.name 4 ee 
返回 每 一 个 满足 上 述 条 件 “ 板 球 俱乐部 ”和 “网 球 俱 乐 
部 ”的 g 节点 的 名 字 

ATCH (p}-[:belongs to] ->1{9g) 限制 查找 gg 市 挟 上 其 有 书 字 “网 球 届 乐 部 ”的 相关 

WHERE g.name = "Tennie Club" 和 应 对 

RETURN Pp.name < ~- 、 
返回 Irene 和 Jack 


看 上 去 这 种 模式 适合 我 们 的 实例 。 通 过 从 “一 个 人 属于 一 个 组 ”的 简单 关系 开始 ， 我 们 仅仅 通过 重复 这 种 关系 就 能 生成 一 个 
复杂 的 图 形 。 我 们 最 初 的 图 2-2 实 际 上 代表 了 整个 图 形 。 

对 于 更 复杂 的 模型 ， 有 了 时 按 相反 的 方 同 思 考 更 容易 理解 。 可 以 首先 在 系统 中 国 一 张 图 把 例子 中 所 有 不 同 的 东西 表示 为 节 氮 ， 
然后 绘制 箭头 表示 出 这 些 节 点 之 间 的 所 有 不 同 种 类 的 关系 。 一 旦 开始 看 到 重复 的 图 案 ， 就 可 以 把 它们 拉 出 来 并 把 它们 归属 为 更 小 
的 图 片 单元 。 


2.1.2 ”图表 建 模 的 一 个 复杂 实例 


让 我 们 多 看 几 个 不 同 的 例子 ， 看 看 它 是 如 何 分 解 成 更 小 的 图 案 的 。 在 大 型 组 织 中 ， 基 于 用 户 不 同 的 角色 、 不 同 的 任务 和 不 同 
的 组 别 授予 其 权限 访问 不 同 的 系统 。 下 面 是 用 户 可 能 具有 的 访问 权限 示例 。 


: 直接 的 一 一 你 有 权限 访问 共享 文件 系统 中 你 自己 文件 夹 中 的 文件 。 


. 基于 某 任务 一 作为 数据 库 的 管理 员 ， 你 有 权限 连接 到 数据 库 控制 台 。 
. 基于 组 成 员 一 一 作为 市 场 和 销售 团队 的 成 员 ， 你 有 权限 连接 到 联系 人 管理 系统 。 


: 基于 对 组 所 有 成 员 指 定 的 任务 一 一 作为 一 个 开发 团队 的 成 员 ， 所 有 的 成 员 都 有 源 代码 控制 提交 的 任务 ， 都 有 权限 从 源 代 码 
库 中 取出 代码 并 进行 修改 后 返回 原 代码 库 。 


图 2-4 是 一 个 未 连接 的 授予 这 些 权限 的 访问 控制 系统 图 。 


图 2-4 访问 控制 系统 中 的 实体 


图 2-5 显 示 了 所 绘 实 体 乙 间 可 能 人 存在 的 天 系 的 同一 图 形 。 
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图 2-5 访问 控制 系统 中 实体 之 间 的 关系 


正如 你 所 看 到 的 ， 有 几 种 从 用 户 到 权限 的 可 能 路 径 。 为 了 找 出 一 个 用 户 所 拥有 的 权限 ， 你 需要 找 出 一 个 用 户 忆 点 通 过 任何 途 
径 连接 的 所 有 权限 节点 。 在 传统 的 关系 数据 库 中 ， 这 需要 一 个 复杂 的 查询 表达 每 一 个 不 同 路 径 的 join 操作 。 


: 从 用 户 直接 到 权限 (一 表 join 操 作 ) 。 

从 用 户 到 组 再 到 权限 (二 表 join 操 作 ) 。 

从 用 户 到 任务 再 到 权限 (二 表 join 操 作 ) 。 

. 从 用 户 到 组 、 到 任务 再 到 权限 (三 表 join 操 作 ) 。 


使 用 Cypher， 一 个 短 的 查询 即 可 实现 : 


MATCH (u:User)-[*] ->(p:Permlsslion) 
WHERE uu.name = "User name" 
RETURN DISTINCT pp.name 


这 将 匹配 任何 第 一 个 具有 用 户 标 签 且 其 指定 的 属性 值 为 姓名 (name) 的 古 点 与 第 二 个 标记 为 权限 节点 的 节操 对， 并且 在 它 
们 之 间 有 一 个 可 以 是 任意 长 度 的 路 径 。 最 后 ， 返 回 所 有 匹配 了 的 权限 名 称 。 


现在 假设 你 想 对 这 个 模型 添加 一 个 新 功能 ， 以 反映 组 织 的 层次 结构 。 用 户 不 仅 可 以 属于 组 ， 组 还 可 以 是 较 大 组 的 下 级 组 ， 例 
如 ，Tester、UX Designer 和 Coder， 可 能 隶属 于 开发 组 的 小 组 。 图 2-6 显 示 了 在 组 之 间 具 有 下 级 组 (subgroup_of) 隶属 关系 
扩展 的 新 模型 。 
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图 2-6 ”具有 支持 下 级 组 扩展 的 访问 控制 模型 


要 改变 关系 数据 库 的 查询 以 支持 此 模型 的 方案 可 不 是 一 件 容易 的 事 ， 而 最 初 模型 的 Cypher 查 询 也 完全 适合 这 一 扩展 的 模 
型 ， 因 为 对 用 尸 查 询 一 个 权限 与 但 询 一 个 关系 没有 任何 区 别 。 


2.2 ”领域 建 模 


在 2.1 节 讨论 的 模型 中 ， 节 点 除了 上 自己 的 标识 名 字 以 外 ， 其 本 身 具 有 的 额外 信息 太 少 。 用 图 形 的 节点 表示 领域 实体 一 一 用 户 
(User) 、 组 (Group) 、 任 务 (Role) 和 权限 (Permission) 是 非常 直观 和 清晰 的 。 但 是 ， 并 非 一 切 事 情 都 必须 成 为 一 个 节 
点 ， 例 如 ， 并 没有 任何 节点 表示 用 户 的 姓名 ， 而 这 是 以 用 户 节 点 的 属性 (property) 表示 的 。 


属性 是 Neo4j 数 据 模型 的 重要 组 成 部 分 ， 而 且 这 也 是 它 不 同 于 关系 数据 库 模 型 的 重要 特征 。 在 Neo 锋 中， 市 点 和 关系 都 可 以 
具有 任意 数量 的 属性 ， 这 是 非常 重要 的 键 / 值 对 (例如 ， 姓 名 /“lrene”) 。 它 们 通常 用 来 存储 厂 点 和 关系 的 特定 属性 。 


让 我 们 考虑 一 个 实体 (以 节点 建 模 ) 和 一 个 实体 的 属性 之 间 区 别 不 太 明 显 的 场景 。 


实体 和 属性 


当 人 们 第 一 次 开始 用 Neo4j 建 模 的 时 候 ， 他 们 用 了 一 个 看 上 去 如 图 2-7 所 示 的 图 形 。 


nas property 


图 2-7 一 个 具有 茶 些 属性 的 用 户 


可 能 有 一 些 场景 ， 这 也 是 建立 用 户 及 其 属性 模型 的 完全 正确 的 方式 ， 但 是 这 里 有 一 泽 警 示 标 志 。 如 果 看 到 一 个 标 有 具有 属性 
(has_property) 或 类 似 标识 的 天 系 ， 应 该 考虑 连接 节点 男 一 端的 节点 是 人 否 真 的 必须 是 一 个 节 上 后。 除非， 出 于 某 些 原 因 ， 你 想 
基于 用 户 上 自己 喜欢 的 颜色 将 他 们 连接 起 来 ， 可 能 没有 必要 对 喜欢 的 颜色 作为 模型 的 一 个 节点 建 模 ， 而 以 用 户 节 点 上 的 属性 为 宜 ， 
对 于 姓名 和 年 龄 属性 也 同样 是 这 样 。 


如 果 你 将 这 些 节 点 转换 成 用 户 节 点 上 的 属性 ， 然 后 重新 命名 剩 下 的 具有 属性 的 天 系 ， 使 其 能 更 确切 地 摘 述 用 户 所 具有 的 关系 
和 其 相关 的 地 址 ， 那 么 这 时 的 示意 图 就 如 图 2-8 所 示 。 


图 2-8 ”一些 节点 转换 为 属性 的 用 户 


地 址 与 姓名 、 年 龄 和 喜欢 的 颜色 不 同 ， 因 为 你 可 能 会 使 用 共享 地 址 的 方式 将 用 户 天 联 起 来 。 一 个 用 户 搬家 后 可 能 会 有 一 个 当 
前 的 地 址 和 原来 的 地 址 ， 或 者 一 列 曾经 住 过 的 地 址 。 因 此 ， 将 地 址 作为 实体 建 模 ， 用 它们 目 己 所 属 的 节点 表示 地 址 比较 合理 


现在 ， 假 设 你 想 要 区 分 一 个 用 户 的 当前 地 址 和 以 前 地 址 ， 一 个 方法 是 附加 一 个 现在 的 〈is_current) 标志 作为 属性 到 地 址 书 
点 上 。 但 是 ， 如 果 两 个 用 户 一 直 住 在 同一 个 地 址 ， 一 个 是 当前 的 地 址 ， 而 另 一 个 是 以 前 的 地 址 ， 那 么 就 无 法 确定 这 个 标志 值 在 什 
么 时 间 为 哪个 用 尸 取 什 么 值 。 用 尸 的 当前 地 址 不 是 地 址 本 身 或 者 用 户 的 属性 ， 但 它们 之 间 是 属于 关系 ,关系 可 以 随 着 时 间 的 变化 
而 改变 ， 束 像 用 尸 从 一 个 地 址 迁移 到 另 一 个 地 址 。 


至 少 有 三 种 方式 来 表述 一 个 地 址 是 用 户 的 当前 地 址 。 第 一 种 方式 是 标注 不 同 的 关系 如 图 2-9 所 示 。 


第 二 种 方式 是 对 关系 本 身 设 置 属性 如 图 2-10 所 示 。 如 果 不 考 虑 用 户 是 否 住 在 现在 的 地 址 中 而 只 是 把 用 户 和 地 址 连接 起 来 ， 
你 可 以 采用 这 种 方式 。 具 有 不 同 的 天 系 类 型 将 使 查询 变 得 复杂 。 
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图 2-9 ”两 个 用 户 对 同一 地 址 具有 不 同 的 关系 


er > Te 
用 户 让 用 户 
| name= Arthur” pe name= Martha 


| aAde= 1 自已 二 3 日 | 
favoriteColor=bl ue 和 


favoriteColor= wy 


em pi 


nags ddress 
{ 1s3- current=false |] 


图 2-10 ”两 个 用 户 对 同一 地 址 具有 不 同 条 件 关 系 


第 三 种 方式 是 将 用 户 的 一 个 占有 地 址 作为 其 自身 的 一 个 节点 。 这 是 一 种 称 作 物化 的 技术 (字面 含义 是 使 其 成 为 一 种 东西 ) ， 
其 中 两 个 节点 之 间 的 天 系 补 分 成 由 一 个 中 间 证 操 连接 的 两 种 天 系 。 当 关系 本 身 与 其 他 实体 有 关系 时 ， 这 种 方法 是 非常 有 用 的 。 例 
如 ， 如 果 一 个 用 户 的 占有 地 址 在 中 介 机 构 管理 的 租约 下 ， 图 2-11 给 出 了 这 种 情况 是 如 何 处 理 的 。 


在 这 种 情况 下 ， 标 签 表示 该 占用 是 人 否 是 当前 地 址 已 经 添加 到 占有 市 点 本 身 ， 但 也 可 以 将 其 设置 为 具有 (has_held) 关系 的 
属性 ， 或 者 用 两 种 不 同 标签 来 表示 现在 的 地 址 与 以 前 的 地 址 。 


当 决 定 是 否 使 用 节操 建 模 实体 的 属性 时 ， 另 一 个 需要 考虑 的 因素 是 用 查询 引 苟 沉 历 图 形 数据 库 时 的 效率 。 例 如 ， 把 一 个 节点 
的 数据 扩展 为 与 男 一 个 节点 的 关系 上 ， 目 的 仅仅 是 为 了 具有 额外 的 属性 ， 通 常 这 并 不 是 一 个 好 的 方法 ， 如 图 2-12 所 示 。 


Ce 并 将 额外 属性 直接 放 在 用 尸 节点 本 


身 。 标 签 是 一 个 强大 的 机 制 ， 在 Neo 颖 的 2.0 版 本 中 引入 ， 用 于 给 集合 分 配 节点 。 一 个 证 点 可 以 有 多 个 标签 ， 所 以 古 点 可 以 视 为 
属于 多 个 集合 ， 也 可 能 具有 交叉 重 便 。 通 过 编写 针对 特定 标签 的 三 点 查询 ， 可 以 做 两 件 事情 : 

Fa 和 -™ 基 二 

"1 name= Arthur TY 中 -证 析 焙 rs 
/i \ Be Ph 介 机 构 i 
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a CUrrent=true: + 有 


| 村 i 
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at address 


三 地 址 、 
& a 


图 2-11 为 了 引进 其 他 参与 者 而 具体 化 用 户 和 地 址 之 间 的 关系 
. 当 在 遍历 图 形 数 据 库 搜索 匹配 模式 时 必须 考虑 减少 节点 改进 查询 遍历 的 性 能 
. 使 用 标签 说 明 节 点 有 具有 的 特定 属性 以 简化 查询 ， 以 便 查 询 不 必 处 理 缺 少 属性 值 的 可 能 性 。 


你 已 经 在 本 章 中 见 过 Cypher 查 询 实 例 中 的 标签 使 用 方式 : 一 个 类 似 u: User 的 表达 式 匹 配 一 个 节点 与 用 尸 标签， 而 忽略 任 
何其 他 的 廿 点。 
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图 2-12 ”一 个 在 相关 UserEx 节 点 存 有 额外 属性 的 用 户 


决定 使 用 哪 种 拉 述 方法 的 关键 是 能 够 容易 查询 和 亿 历 数据 中 包含 的 数据 模式 。 如 果 很 难看 出 两 条 信息 是 如 何 相 连接 的 ， 但 实 
际 上 它们 的 关系 是 非常 简单 的 ， 那 么 考虑 更 直接 地 将 它们 联系 起 来 。 如 果 有 这 样 的 节操 ， 其 唯一 的 目的 丈 是 存放 属于 其 他 实体 的 
一 些 信息 ， 那 么 考虑 将 这 些 信息 放 入 该 实体 的 属性 中 。 


在 这 个 阶段 ， 不 要 太 担 心 能 否 找到 合适 的 模型 。 使 用 Cypher 很 容易 重 构图 形 数据 库 ， 将 现 阶段 模型 中 的 仅 仪 为 隐 陈 天 系 明 
确 为 显 陈 关系。 对 于 图 形 数据 库 没有 标准 模式 一 只 有 最 适合 具体 应 用 的 形式 。 


2.3 ”更 多 实例 


我 们 将 以 几 个 来 自 于 不 同 领 域 的 例子 结束 本 章 ， 这 些 例 子 既 说 明了 Neo 当 可 以 建 模 的 领域 范围 ， 也 阐述 了 两 对 相互 对 立 的 概 
念 ， 即 在 图 形 数 据 库 中 ， 模 型 中 的 元 素 是 隐 陈 朱 述 还 是 显 陈 描述 ， 或 者 数据 通 单 是 不 变 的 还 是 可 变 的 。 


让 我 们 先 回顾 一 下 前 面 提 到 的 地 铁 站 的 例子 。 


2.3.1 ”地 铁 车 站 实例 


我 们 的 第 一 个 例子 涉及 在 什么 时 候 应 该 明确 地 使 用 节点 与 天 系 对 数据 直接 建 模 和 在 什么 时 候 应 当 隐 式 建 模 (但 可 通过 查询 获 
得 数据 ) 的 问题 。 在 这 个 例子 中 ， 我 们 对 伦敦 地 铁 系 统 的 车 站 、 线 路 和 连接 进行 了 建 模 。 我 们 对 两 个 方面 感 兴趣 : 哪些 车 站 和 直接 
相连 ， 哪 些 车 站 在 哪 条 线路 上 。 


这 里 最 大 的 问题 是 要 不 要 把 地 铁 线路 直接 作为 模型 的 节操， 或 是 作为 隐 式 的 天 系 属性 。 如 果 将 它们 建 模 为 书 上 各 ， 那 么 你 可 能 
需要 连接 各 个 车 站 及 轨道 线 上 的 每 个 轨道 段 ， 如 图 2-13 所 示 。 
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图 2-13 ”两 个 具有 连接 的 地 铁 站 视 为 单一 的 一 个 轨道 段 


这 是 一 个 非常 繁忙 的 模型 ， 如 果 你 试图 对 多 条 线路 通过 多 个 车 站 进行 建 模 ， 那 么 你 的 模型 很 快 蕊 会 变 得 相当 复杂 。 相 反 ， 如 
果 你 将 地 铁 续 路 作为 天 系 的 属性 建 模 ， 那 么 你 的 模型 融 简 单 多 了 ， 图 2-14 显 示 了 两 个 站 由 两 个 不 同 线路 的 连接 。 


DNTIECtEeEd 
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图 2-14 连接 于 两 条 不 同 线路 的 两 个 地 铁 车 站 


然而 ， 为 了 知道 Euston 站 在 哪 条 线路 上 ， 你 不 得 不 找 出 它 与 哪个 车 站 相连 。 斑 运 的 是 ,使 用 Cypher 查 询 可 以 很 容易 地 做 到 


这 一 点 : 


MATCH (sl:Staticon)- [r:connected] - (s2:Station) 碍 投 与 EustoDn 站 相符 的 所 有 村 上 站， 并 回 
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雁 有 ERBE 号 1] .name=" EUsSton" 
RETURN DISTINCT Yr. 1]1ine 


这 将 会 找到 所 有 Euston 站 与 其 他 和 车 站 的 连接 ， 并 返回 所 有 那些 连接 的 不 同 线路 属性 值 。 


这 两 种 方式 都 可 以 对 地 铁 系统 进行 建 模 并 包含 完全 相同 的 信息 。 可 以 通过 查询 将 第 一 种 方式 建 模 的 图 形 数据 转换 为 第 二 种 方 
了 式 建 模 的 图 形 数据 ， 反 过 来 也 可 以 ， 并 不 会 丢失 任何 信息 。 那 么 ， 到 话 选 择 哪 种 方式 好 呢 ” 答案 主要 取决 于 你 如 何 去 填 元 数据 库 
和 打算 如 何 进行 查询 。 


在 第 一 种 建 模 方式 中 ， 如 果 必 须 创建 管理 显 式 节点 和 关系 来 表示 地 铁 线路 、 哪 些 车 站 在 哪些 线路 上 ， 则 数据 库 将 比 只 用 节 
点 代表 车 上 站、 关系 代表 车 站 之 间 的 连接 条 重 很 多 ， 并 且 也 更 难 理解 。 运 行 诅 询 以 查找 某 一 特定 线路 上 的 所 有 车 站 将 非常 快 ， 因 为 
Neo4j 数 据 库 引 | 掌 将 仪 仪 从 一 个 节点 沿 着 关系 到 所 有 与 它 直 接 相 连 的 节操 : 
MATCH (1l:Line)<-[:on line] - ts:Station) 


WHERE 1 .name= "Central" 
RELLIRK ss.NAame 


es 
下 六 二 二 上 


= he be Ea Ee le ee je pe i 
省 罕 为 “中 心 强 路 ”的 书 扎 和 直接 与 它 相连 


如 果 对 姓名 (name) 属性 和 续 路 (line) 节点 做 过 系 引 ， 这 个 查询 是 非 钊 快 的 ， 因 为 Neo4j 碍 询 引 擎 会 使 用 这 个 系 引 找 出 
尼 的 索引 节操 。 


第 二 种 建 模 方式 的 相应 查询 则 需要 对 图 形 数据 库 更 多 的 声 历 才 可 以 得 到 结果 。 
MATCH (ls:Station})-= [r:connected]-1{) 


下 了 
WHERE rr.line="Centraln 
RETIIRN DISTINCT gg. name 


出 3 汗 芋 由 好 下 ”法 扩 副 时 一 小 在 让 册 所 吉 杰 市 
查找 通过 “中 心 线 路 ”连接 到 另 一 个 车 站 的 所 有 车 站 


回 它们 的 和 名字 


在 这 种 情况 下 ， 数 据 库 引 掌 必须 考虑 一 对 车 站 节点 之 间 的 每 一 个 连接 关系 ,统计 具有 指定 的 线路 属性 的 所 有 节点 ， 然 后 返 
特定 的 车 站 名 字 。 如 果 这 是 一 个 可 能 会 经 常 使 用 的 查询 ， 那 么 束 值 得 通过 创建 代表 那些 信息 的 显 式 节 点 和 关系 以 便 更 容易 获得 


些 信 息 。 


本 例子 说 明 在 不 同 的 领域 建 模 时 ， 有 时 将 一 些 实体 在 图 形 数据 库 中 以 隐 式 建 模 而 不 是 用 专用 的 节操 以 显 式 建 模 是 合理 的 。 相 
反 ， 有 了 时 则 将 隐 式 信息 表面 化 并 以 显 式 建 模 ， 以 便 Neo 泊 查询 引擎 能 更 快 的 查找 到 它们 。 


2.3.2 ”乐队 成 员 实 例 
第 二 个 例子 涉及 处 理 随 时 间 不 断 变 化 的 信息 ， 以 便 分 辨 不 变 的 问题 和 变化 的 问题 。 
假设 你 想 追 踪 哪 一 个 音乐 家 在 不 同 的 摇滚 乐队 演奏 哪 一 种 乐器 ， 一 个 简单 的 模型 可 能 会 如 图 2-15 所 示 。 


用 该 模型 的 一 个 问题 是 乐队 的 成 员 会 经 常 友 生变 化 。 为 了 处 理 这 种 变化 ， 可 能 需要 创建 表示 特定 时 间 事 物 状态 的 中 间 节 点 。 
可 以 引入 表示 乐队 阵容 的 节点 ， 记 录 某 一 特定 专辑 录音 时 的 阵容 ， 如 图 2-16 所 示 。 
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图 2-15 一 个 表示 乐队 成 员 和 录音 专辑 的 简单 例子 


注 : The Tax Evaders 是 乐队 的 名 称 ，Here Come The Tax Evadets 是 专辑 名 称 。 
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图 2-16 ”表示 同一 个 乐队 不 同 阵 容 的 一 个 较 复 杂 的 例子 


用 该 模型 时 ， 你 可 以 很 容易 地 查询 到 Tax Evaders 乐 队 (任何 阵容 ) 录制 的 所 有 录音 专辑 : 


入 回 “Here 
Come The Tax 
Evaders ”各 
“Surftin WitH 
The Tax 


Ewvaders”™ 


MATCH (a:Blbum)<-[:recorded album]- (1l:Lineup}-[:lineup of] -> '(b:Band) 
WHERE b.name="The Tax Evaders" 
RETURN a.name 


但 是 ， 你 可 能 很 容易 地 查询 到 Ritchie MacNeice 演 奏 鼓 的 专辑 : 


MATCH {a:Album)<-[:recorded album] - (1l:Lineup}<-[:played in]j- (m:Musician) Come The 
WHERE m.name="Ritchie MacNelice" 2 
RETURN a.name 


在 图 2-11 中 有 一 条 不 变 的 信息 ， 即 有 一 个 名 为 Tax Evaders 的 乐队 ， 即 使 其 成 员 变 化 ， 该 乐队 仍 保持 其 完整 性 。 可 以 将 Tax 
Evaders 乐 队 构 成 的 变化 用 节点 摘 述 其 不 同时 间 的 即时 状态 ， 并 用 阵容 (lineup_of) 关系 连接 这 些 状态 到 中 央 节 后， 表示 它们 是 
同一 事物 的 不 同 状 态 。 同 样 ， 不 同音 乐 家 在 乐队 中 演奏 的 身份 保持 不 变 ， 尽 管 他 们 与 乐队 (也 可 能 是 其 他 乐队 ) 的 关系 将 随时 间 


这 个 例子 展示 了 一 个 具体 化 的 实例 一 一 捅 述 实 体 之 间 的 关系， 例如 音乐 家 和 乐队 之 间 的 天 系 ， 乐 队 作 为 一 个 节操 与 其 本 身 
的 关系 。 阵 容 是 乐队 在 特定 时 刻 的 构成 ， 在 摇 深 乐 快速 变化 的 世界 里 ， 这 个 概念 必 不 可 少 。 毫 不 夸张 地 襄 ， 具 体 化 同样 有 用 。 例 
如 ， 建 模 人 与 其 居住 的 地 址 、 软 件 许 可 与 其 所 激活 的 电脑 。 


2.4 “本章 小 结 


在 本 章 中 介绍 了 Neo4j 数 据 建 模 的 灵活 性 ， 以 及 对 同一 领域 可 以 有 多 种 可 能 的 描述 方法 。 仅 仅 以 铅笔 和 纸 就 可 以 很 容易 地 开 
始 数 据 建 模 ， 但 是 你 应 该 准备 好 尝试 把 相同 的 数据 放 在 不 同 的 地 方 一 一 属性 可 以 作为 节点 、 作 为 关系 、 或 拉 出 来 放 到 自身 的 一 个 


节点 上 。 


我 们 已 经 了 解 了 一 些 数据 建 模 的 策略 ， 以 便 适 合 于 不 同 的 查询 模式 ， 选 择 哪些 数据 用 节点 以 显 式 描述 ， 哪 些 节点 作为 隐 式 描 
述 并 可 以 在 以 后 的 数据 查询 模式 中 进行 推断 。 我 们 也 看 到 了 随时 间 变 化 的 数据 ， 并 看 到 了 变化 数据 和 不 变数 据 的 一 个 混合 建 模 模 
式 。 


本 章 的 例子 显示 了 图 形 数据 建 模 适 合 于 多 种 领域 的 应 用 。 在 下 一 章 中 ， 你 将 看 到 如 何 遍历 数据 模型 ， 以 高 效 和 强 有 力 地 检索 


获取 数据 。 


第 3 草 ”Neo4 开 友 入 | 


本 章 包 括 以 下 内 容 : 
` 图 形 数据 建 模 
: 使 用 Neo4j Java API 建 立 连接 的 节点 
: 使 用 属性 为 节点 和 关系 添加 额外 信息 
` 区 分 不 同 节点 类 型 的 策略 


第 1 章 演示 了 应 用 Neo 有 4 作为 图 形 数据 库 对 改进 性 能 和 扩展 性 的 可 能 性 ， 也 讨论 了 对 图 形 建 模 的 数据 如 何 正好 适应 于 Neo4j 
数据 模型 ， 现 在 天 了 该 动手 实践 的 时 | 间 了 。 


在 本 章 中 ， 通 过 建 模 和 建立 一 个 Neo4j 图 形 数据 库 的 实例 ， 介 绍 Neo4j 核 心 java AP| (Neo4j Core Java API) 。 第 1 章 中 ， 
我 们 建立 了 社交 网 络 的 例子 ， 但 现在 我 们 会 让 它 稍微 复杂 一 些 ， 人 允许 用 户 对 他 们 看 过 的 电影 进行 评级 ， 


社交 网 络 中 的 用 户 可 能 是 朋友 。 上 此外， 用户 可 以 标记 他 们 已 经 看 过 的 电影 ， 根 据 他 们 对 电影 的 喜欢 程度 ， 用 1~ 5 颗 星 给 这 些 
电影 评级 。 


在 本 章 的 第 一 部 分 ， 我 们 将 模仿 软件 的 设计 过 程 ， 使 用 一 系列 图 表 为 本 例 的 需求 建 模 。 在 第 二 部 分 ， 我 们 将 演示 如 何 使 用 
Neo4 核 心 Java API 创 建 同一 个 社交 网 络 。 


3.1 ”图 形 数据 结构 建 模 
在 深入 探索 Neo4j 之 前 ， 我 们 将 这 个 社交 网 络 域 模型 描述 为 一 个 通用 的 图 形 。 如 果 在 办 公 室 建 模 ， 我 们 可 能 在 白板 上 画 出 模 
型 。 在 本 章 中 ， 我 们 将 图 示 说 明 这 种 白板 建 模 的 方法 。 


首先 ， 社 交 网 络 中 需要 有 几 个 用 尸 ， 用 己 用 方 框 表 示 ， 如 图 3-1 所 示 。 
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用 户 3 


图 3-1 方 框 表示 社交 网 络 中 的 用 户 


我 们 的 目标 是 建立 电影 爱好 者 的 一 个 社交 网 络 ， 因 此 ， 下 一 步 很 自然 束 是 为 模型 添加 社交 元 素 。 首 先 用 箭头 连接 是 朋友 关系 
的 用 尸 。 比 如 说 用 尸 1 有 两 个 朋友 ， 分 别 是 用 尸 2 和 用 尸 3。 图 3-2 给 出 了 朋友 之 间 相 互 连 接 的 示意 图 。 


用 户 3 


图 3-2 ”朋友 之 间 相 互 连 接 的 一 个 简单 社交 网 络 示 意图 
全 注意 


为 了 在 句法 上 正确 ， 朋 友 关 系 应 该 是 双向 的 ， 但 是 ，Neo4j 图 形 数 据 库 是 单 向 的 ， 这 意味 着 每 一 个 关系 已 经 定义 好 了 起 始 和 
终止 节点 。 在 Neo4j 中 ， 双 向 关系 可 以 用 两 个 独立 的 关系 建 模 ， 每 一 个 关系 代表 一 个 方向 。 为 了 简单 起 见 ， 我 们 将 关系 定义 为 单 
向 关系 。 正 像 在 后 面 的 章节 中 你 会 看 到 的 那样 ， 这 并 不 会 影响 Neo4j 的 查询 能 力 ， 因 为 关系 可 以 在 两 个 方向 上 跟踪 ， 这 将 会 大 大 


简化 模型 。 


现在 ， 有 了 几 个 用 尸 并 用 方 框 表示 ， 他 们 在 社交 网 络 中 相互 是 朋友 。 为 了 区 分 不 同 的 用 户 ， 可 以 为 每 个 用 户 设置 一 个 name 
属性 ， 如 图 3-3 所 示 。 


图 3-3 最 终 看 上 去 像 一 个 合适 的 社交 了 网络。 但 是 我 们 的 目标 是 建立 电影 爱好 者 的 一 个 社交 网 络 ， 因 此 ， 下 一 步 是 添加 一 个 新 
的 电影 节操 。 


name: John Jonnsan : 一 大 name: Kate Smith 


2 


name*: Jack Jeffries 


全 | 
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图 3-3 ”给 每 个 用 户 添 加 name 属 性 的 复杂 社交 网 络 示意 图 


可 以 用 一 个 具有 name 属 性 的 方 框 代 表 电 影 ， 如 图 3-4 所 示 。 


与 FEIEND OF , 
- > Eate Smith 


name*: John Johnson 


IS FRIEND OF 


name*: Jack Jef fries 


name: Fargo name: Allen 


图 3-4 模型 中 引进 电影 节点 


最 容易 区 分 user 方 框 和 


这 里 有 一 个 问题 : 因为 用 户 和 电影 都 用 具有 name 属 性 的 方 框 表示 ， 所 以 没有 任何 办 法 区 分 它们 。 
movie 方 框 的 万 法 是 引进 一 个 type 属 性 ， 用 不 同 的 值 代表 不 同 的 对 象 。 具 有 相关 类 型 的 该 模型 如 图 3-? 所 示 。 


最 后 一 步 是 将 电影 爱好 者 元 素 添加 到 社交 了 网络 中 。 璧 如 说 John 喜 欢 《Fargo》 并 给 它 打 5 颗 
《Alien》5 颗 星 。 加 上 


现在 已 接近 例子 的 尾声 
星 ，Kate 看 了 《Heat》 并 给 它 打 了 3 颗 星 ，Jack 喜 欢 《Fargo》 和 《Alien》， 并 给 了 《Fargo》4 颗 星 ， 


影评 级 的 模型 如 图 3-6 所 示 。 
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name: Heat 
type: Movie 


六 
name: Fargo 
type: Movie 


name: Allen 
type: Movie 


图 3-5 ”引进 type 属 性 区 分 用 户 与 电影 


IS FRIEND OF 


* ohn Johnson Ie* Kate Smith 


: Ser Coe: [ser 


IS FRIEND OF 


HAS SEEN | HAS SEEN 


| i 
| 1 i Lm | wal 
3 1 
| 人 
i 
i ' 
| 何 瑟 听 总 仿 珂 而 大 天 \ 
i I 总 ko E E, | a ' I 地 下 EM 1 
二 Fr 人 
Stars: 4 \ gtarst 3 
| ry 和 1 
首 和 i 
. . | 司 


niame: Heat 


type: Movie 


name: Alien 
type: Movie 


name: Fargo 


type: Movie 


图 3-6 ”电影 爱好 者 社交 网 络 的 完整 模型 
纤 上 ， 我 们 有 了 一 个 代表 社交 网 络 的 模型 ， 它 用 图 表 表 示 。 


这 个 建 模 过 程 是 在 每 一 个 软件 项 目 开始 阶段 的 典型 做 法 。 这 些 图 形 帮助 我 们 理解 项 目的 需求 并 使 得 决策 模式 容易 和 透明 。 建 
模 练 习 的 结果 经 常 以 天 于 模型 、 需 求 、 模 式 决 策 、 建 议 以 及 图 表 的 文件 形式 出 现 。 

模型 准备 好 后 ， 开 友 团 队 束 会 接 过 项 目 ， 基 于 模型 和 架构 开始 编写 代码 并 形成 软件 产品 。 作 为 流程 的 一 部 分 ， 模 型 应 该 是 标 
准 化 的 ， 并 映射 到 数据 的 持久 层 ， 这 通常 是 指 天 系数 据 库 。 

有 趣 的 是 ， 图 3-6 所 示 的 社交 网 络 表示 为 一 个 图 ， 用 尸 和 电影 作为 节操 ， 关 系 连 接着 朋友 (1S_FRIEND_OF) 和 电影 的 评级 
(HAS_SEEN) 。 使 用 面向 对 象 编程 (ODP) 技术 ， 同 样 的 图 形 结构 一 般 会 用 到 代码 中 。 数 据 也 会 存 到 几 个 表格 中 ， 并 使 用 天 
系 代数 访问 。 这 种 从 图 形 对 象 模型 到 关系 数据 库 或 从 关系 数据 库 到 图 形 对 象 的 转换 给 项 目 添加 了 很 多 复杂 性 并 增加 了 编写 代码 的 
工作 量 ， 影 响 了 项 目的 效率 并 延长 了 项 目的 交付 时 间 。 这 仅仅 是 因为 不 得 不 考虑 、 实 施 和 配置 一 个 转换 机 制 ， 例 如 ， 使 用 对 象 天 

系 映 射 (DRM ) 工具 。 


这 里 正 是 Neo4j 的 用 武之 地 。 不 像 企 关系 数据 库 中 以 额外 的 精力 创建 映射 机 制 储 存 类 似 于 图 形 的 结构 ， 而 是 用 Neo4j 本 身 具 
有 的 节点 和 关系 存储 图 形 对 象 。 这 可 以 让 我 们 对 软件 应 用 程序 建 模 和 编写 代码 同时 进行 ， 并 或 多 或 少 使 用 来 自 于 日 板 的 结构 和 本 
语 直接 编写 代码 。 


3.2 ”使 用 Neo4j AP 
当 使 用 Neo4 作 为 图 形 数据 结构 的 底层 存储 时 ， 建 模 和 编写 代码 可 以 同时 进行 ， 这 将 在 下 面 的 章节 中 介绍 。 


3.2.1 创建 节点 


在 社交 网 络 中 ， 我 们 可 以 从 代表 用 尸 的 节操 实例 化 图 形 数据 库 开始 ， 图 3-1 (在 这 里 重新 绘制 为 图 3-7) 是 这 一 阶段 的 模型 


图 ， 包 合 三 个 用 户 。 


我 们 可 以 编写 Java 代 码 创建 图 3-7 所 示 的 图 形 数据 。 最 开始 的 两 行 (程序 3-1 和 程序 3-2) 建立 了 单个 user 节 点 ,使 用 了 Java 
6 (Neo4j 1.9.X) 和 Java 7 (Neo4j 2.0.X) 的 习惯 风格 。 


全 


用 户 ”1 用 户 2 


用 户 3 
图 3-7 只 有 一 个 节点 实体 的 图 形 


这 两 种 版 本 的 最 大 区 别 是 对 事务 的 处 理 。 创 建 节 点 的 API 本 身 是 相同 的 ， 但 是 ， 由 于 这 是 我 们 给 出 的 第 一 段 程序 代码 ， 因 此 
我 们 展示 了 两 个 版 本 的 示例 代码 。 对 于 以 后 ， 除 非 另 有 说 明 ， 人 否则 本 章 和 本 书 的 后 面 章 节 将 会 使 用 java 7 事务 管理 模式 。 


【程序 3-1】 在 Neo4j (Java 6/Neo4j 1.9.X 风 格 ) 创建 单个 用 尸 节点 


GraphDatabaseService graphDb = 1 ] 创建 Neo4] 
new GraphDatabaseFactory!) ’ 数据 夸 创建 Neo4j 
.newEmbeddedDatabasel'"/tmp/neodi/").; 吉 才 
— 六 
Transaction tx = graphDb.beginTx'(}:; < | 
try 1 
LSEerl] = , graphDb .CreateNaodell): Eh 剖 | 建 娄 据 座 中 的 
输出 部 节 占 [> logger.,infol"created User:" + USerl,getIdl)); 半点 
et tx.Sguccess (); < ee 
指定 的 ID 7 
} catch (Exception el) 1{ 提交 事务 
tx,.failurel): < 
} finally 1 如 果 肖 到 意外 发 生 ， 标 记 
| 人 无 论 结果 如 何 ， 结 束 事务 以 便 回 滚 
事务 
【程序 3-2】 在 Neo4j (Java 7/Neo4j 2.0.X 风 格 ) 创建 单个 用 尸 节 氮 
训 医 : ] 
GraphDatabaseService graphDb = new Wy be: Neo 二 
GraphDatabaseFactory() .newEmbeddedDatabase ("/tmp/neod4j/"}; - 数据 库 
try (Transaction tx = graphDb.beginTx()) { < 
地 创建 Neo4j 事务 


> NMode userl = graphDb .createNoae () ; 
库 logger.info{("created user:"+uSerl.getId!})}:; 4 


中 的 节点 tx.success().; 二 
手 变 事 旁 


在 这 两 种 风格 中 ， 第 一 步 是 实例 化 Neo4j 数 据 库 (人 @) ， 需 要 提供 文件 系统 存储 数据 的 位 置 作为 构造 函数 参数 。 如 果 这 是 一 
个 已 经 仔 人 在 的 Neo4j 数 据 库 ， 融 会 使 用 这 个 数据 库 。 如 果 指 定 的 位 置 没 有 数据 库 ，Neo4j 融 会 在 那个 位 置 创建 一 个 空 的 数据 库 。 


数据 库 将 只 能 建立 一 次 并 在 整个 应 用 程序 周期 中 使 用 。 在 下 面 的 程序 代码 示例 中 ， 我 们 假设 使 用 的 是 一 个 已 经 他 在 的 空 的 Neo4j 
数据 库 实例 。 


前 面 已 经 提 到 Neo4j 是 一 个 与 ACID 完全 兼容 的 图 形 数据 库 ， 融 像 其 他 的 数据 库 所 期 望 的 一 样 ， 文 持 所 有 的 标准 事务 型 属 
性 。 当 我 们 使 用 Neo4j 的 内 绕 式 数据 库 时 ， 事 务 的 边界 是 由 Neo4j 核 心 Java API 程 序 化 管理 的 。 在 两 个 程序 中 的 步骤 @ 和 步骤 @ 
(程序 3-1 中 的 步骤 和 人 @) 是 Neo4j 核 心 Java API 的 部 分 事务 管理 (如 果 还 不 能 全 部 理解 ， 也 不 要 着 急 ， 第 7 章 将 对 Neo4j 的 事 
务 进行 深入 的 讨论 ) 。 由 于 所 有 的 Neo4j 操 作 将 在 一 个 事务 中 完成 ， 因 此 你 将 会 在 代码 实例 中 看 到 用 Neo4j 编 写 的 几 行 相 同 的 程 
序 代 码 。 没 有 这 几 行 程序 代码 ， 程 序 就 不 能 运行 (在 Neo4j 1.9 及 以 下 版 本 中 ， 只 有 事务 是 强制 性 的 操作 ， 并 用 于 更 新 数据 库 。 
但 是 从 2.0 及 以 后 的 版 本 中 ， 读 操作 也 是 强制 性 的 ) 。 现 在 ， 需 要 注意 的 是 每 一 个 访问 Neo 有 数据库 的 代码 段 要 么 在 
try/catch/finally (Neo4j 1.9/Java 6) 块 中 执行 ， 要 么 在 try (用 资源 尝试 ) 块 中 实施 (Neo4j 2.0/Java 7) ， 在 执行 代码 中 融 
是 以 这 样 的 模式 管理 事务 的 边界 。 


在 这 两 种 方法 中 ， 例 子 的 核心 部 分 是 try 代 码 块 中 的 代码 ( 合 、@) 。 出 于 一 致 性 的 原因 ， 我 们 将 把 事务 管理 代码 放 入 本 章 
的 所 有 例子 中 ， 但 是 第 7 章 将 深入 过 论 事务 处 理 和 APl。 


GraphDatabaseService.createNode () 方法 创建 了 Neo4j 数 据 库 中 的 节点 ( 合 ) 。 这 个 方法 返回 了 创建 的 节点 本 身 ， 并 
可 以 检查 其 属性 或 对 其 做 进一步 的 处 理 。 在 前 面 的 程序 中 ， 正 在 使 用 返回 的 节点 实例 输出 其 由 Neo4j 数 据 库 产生 的 内 部 编号 (人 @ 
) sg 


现在 我 们 已 经 看 到 了 创建 单个 user 忆 点 的 过 程 ， 但 是 我 们 是 在 创建 一 个 社交 网 络 ， 所 以 需要 一 些 用 性。 程序 3-3 创 建 了 另外 
3 个 用 己 。 


【程序 3-3】 ”在 一 个 事务 中 创建 多 个 书后 


try (Transaction tx = graphDb.beginTx(}) 1 

Node userl = graphDb.createNode ().; 
looger.infol"created user: "+UsSerl .gqetId()).; 
Node user2 = graphDb.createNode(): 
logger.infol'created User: "+User2.getId()})., 
Node USEer3 = graphDb.createNodel().:; 
logqger,1info(l"created user: "+uUSEer3 ,gqetId(})}.; 
tx. SUCCegs(); 


经 过 程序 3-3 的 操作 后 ， 使 用 Neo4j 图 形 数据 库存 储 的 图 形 将 在 对 象 模型 和 硬盘 中 与 图 3-7 完 全 一 样 。 


下 一 步 是 用 关系 将 创建 的 用 户 连接 起 来 。 


3.2.2 ”创建 天 系 


在 开始 实施 将 用 户 作为 朋友 连接 起 来 乙 前 ， 提 醒目 己 注意 图 3-2 所 示 的 模型 图 ， 在 这 里 重新 绘制 为 图 3-8。 


用 由] 


| | E13 
IS FRIEND OF 用 万: 


用 户 3 


图 3-8 用 朋友 关系 连接 用 户 的 一 个 简单 社交 网 络 图 


天 系 是 图 形 数据 库 除 书 点 以 外 的 另外 主要 实体 。 每 一 个 关系 都 有 一 个 名 字 ， 名 字 代 表 标 签 或 关系 的 


尖 邢 J 


类 型 。 在 Neo4j 核 心 Java 
API 中 ， 关 系 是 用 RelationshipType 接 口 定义 的 ， 它 定义 了 单个 方法 返回 关系 的 名 字 ， 下 面 的 程序 给 出 了 示例 。 


public interface RelationshipTypel! 
public String name (li); 


在 社交 网 络 的 例子 中 ， 我 们 将 在 用 户 之 间 建 立 朋 友 关 系 。 要 实现 这 一 目标 ， 需 要 使 用 RelationshipType 接 口 : 


public class IsFriendof implements RelationshipTypel 


| ISFriendOof 类 实现 

i | 了 ti1GnNnNSshinTpe 并 | 

DUubBlic Str1ing namel) | RelationshipType 楼 
return "IS FRIEND OF",; namel1) 方 注 谤 回 储 

| 属 使 用 的 关系 标签 


RelationshipType 接 口 有 一 个 有 趣 的 副作用 ， 它 定义 的 唯一 方法 (String name () ) 的 签名 看 上 去 与 Java 的 所 有 枚 举 方 法 


的 签名 完全 一 样 。 这 就 给 了 我 们 一 个 选择 ， 当 使 用 Java 枚 举 实现 Neo4j 的 关系 类 型 时 ， 可 以 以 一 种 更 强 类 型 化 、 更 富有 表现 力 和 
更 简洁 的 方式 。 下 面 的 程序 示例 用 Java 枚 举 实现 同样 的 IS_FRIEND_OF 关 系 类 型 


public enum MyRelationshipTypes implements RelationshipTypel 
IS FRIEND OF:; 


按照 标准 的 榴 举 约定 ， 枚 举 的 名 字 代 表 关 系 的 名 字 。 


DynamicRelationshipType 类 
如 果 你 知道 在 编译 时 需要 什么 样 的 关系 


类 型 ， 


定义 一 个 实际 的 类 ， 或 者 按 推 荐 的 方法 去 做 ， 最 好 使 用 枚 举 习 语 代 表 关 系 。 然 
而 ， 也 可 能 有 这 样 的 情况 ， 只 有 在 运行 时 才能 知道 关系 类 型 ， 并 且 仍 然 需要 一 种 方法 来 表示 它 。 在 这 种 情况 
下 ，org.neo4j.graphdb.DynamicRelationshipType 类 的 使 用 将 变 得 非常 方便 。 


下 面 的 程序 展示 了 用 DynamicRelationshipType 类 如 何 创建 IS_FRIEND_OF 关 系 。 


String runtimeVal = "IS FRIEND OPF"; 
RelationshipType rel = DynamilcRelaticonshipType.withName (runtimeVal): 


现在 已 经 定义 了 将 使 用 的 关系 ， 束 可 以 用 这 些 关 系 建 YVuser 节 操 之 间 的 联系 。 建 立 两 个 节操 之 间 的 关系 ， 需 要 调用 节操 之 一 
的 Node.createRelationshipTo (http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 并 需要 把 连接 和 连接 类 型 传递 给 目标 节 


ANA 


四 注意 


就 像 前 面 提 到 的 ，Neo4j 图 形 数 据 库 是 直接 用 关系 定义 起 始 节 点 和 终止 节点 的 。 当 调用 cteateRelationshipTo 方 法 时 ， 调 用 方法 
所 在 的 节点 将 成 为 起 始 节 点 ， 作 为 参数 传递 的 节点 将 成 为 终止 节点 。 这 将 不 会 影响 查询 的 灵活 性 和 性 能 ， 这 一 点 你 将 会 在 下 一 章 


中 见 到 。 


与 在 所 有 的 图 形 数据 库 中 写 操作 语句 一 样 ， 关 系 的 创建 需要 运行 事务 。 程 序 3-4 显 示 了 怎样 在 以 前 已 经 创建 的 user 节 操 之 间 
创建 IS FRIEND OF 关系 。 


【程序 3-4】 使 用 Neo4j 核 Java API 在 节点 之 间 建 立 关 系 


Dn 
try (Transaction tx = graphDb.beginTx()) 1 < 


| , | 从 userl 节点 至 r2 节点 

USEerl .createRelationshipTo (user2, | 
i | 昌 | 本 里 = 了 平 二 站 -ad 六 TT 45 本 
MyRelationsnipTypes, ls FRIEND OOF): 建立 IS FRIEND OF 区 系 


userl,createRelationshipTo (user3, 用 同 桩 的 技术 将 User1 与 
MyRelationshipTypes.1IS FRIEND OF), user3 作为 朋友 连接 起 来 
tx.Success().; 


| 


下 一 步 ， 我 们 将 利用 name 属 性 识别 图 形 中 的 用 户 。 


3.2.3 ”为 万 点 示 加 属性 


Neo4 是 一 个 直接 的 属性 图 形 。 属 性 图 形 的 意思 是 每 一 个 图 形 实体 能 够 具有 多 个 属性 值 。 属 性 以 键 值 对 存储 并 以 属性 名 为 键 
引用 属性 值 。 为 了 说 明 属 性 的 概念 ， 下 面 我 们 将 演示 如 何 给 user 节 点 添加 name 属 性 。 


给 节点 添加 属性 ， 需 要 调用 目标 节点 上 的 方法 Node.setProperty (name，value) 。 下 面 的 程序 3-5 显 示 了 如 何 使 用 核心 
Java API 给 所 有 的 用 户 添加 name 属 性 。 


【程序 3-5】 ”给 用 户 节 点 添加 name 属 性 


try (Transaction tx = graphDb.beginTx()) | 
USerl,. setPropertyl. name', "John Johnson"); < A 2 -| Fe 
上 7 es 1 1 绽 iseri 设置 mame 属 性 ， 后 面 的 
USerI2 .SetPropertyl"name", "Kate 和 mL 七 中 ; 
User3.setPropertyl"name", "Jack Jeffrieg")., 
tx.successt{): 


uUSer2 和 和 User3 忆 要 设置 name 属性 


现在 已 经 有 了 一 个 更 加 丰 语 的 模型 ， 这 里 的 用 户 具 有 了 名 字 并 且 可 以 通过 名 字 区 分 不 同 的 用 户 。 


全 注意 
在 Neo4j 中 ， 必 须 给 添加 的 每 一 个 属性 设置 属性 值 。 换 名 话说 ，Neo4j 中 不 允许 null 属 性 值 。 


前 面 例子 中 的 属性 值 是 字符 串 型 的 。 但 是 Neo 笑 支持 许多 不 同 的 数据 类 型 而 且 均 可 以 应 用 于 节操 的 属性 值 。 表 3-1 列 出 了 可 
以 使 用 的 属性 类 型 及 其 与 Java 相 对 应 的 数据 类 型 。 


表 3-1 Neo4j 中 的 属性 类 型 


描 述 Java 类 型 
Unicode 值 序列 java.lang.Sstring 
单一 Unicode 值 char 
( 统 ) 
描 述 Java 类 型 
页 / 假 boolean 
8 位 整 型 byte 
16 位 更 型 short 
32 位 整 型 int 
64 位 整 型 long 
32 伍 玉 扣 型 double 
64 位 浮 点 型 float 
以 上 所 有 类 型 的 数组 [] 


具有 属性 的 节点 是 无 机 制 、 半 结构 化 的 元 素 。 每 一 个 节点 可 以 具有 任意 数量 的 属性 。 程 序 3-6 演 示 了 如 何 给 不 同 的 节点 添加 
不 同 的 属性 。 


全 注意 
关系 也 可 以 添加 属性 ， 本 章 后 面 将 涉及 给 关系 添加 属性 。 


【程序 3-6】 ”给 节操 添加 不 同类 型 的 属性 


| 设置 蔬 点 属性 
设置 节点 try I!Transaction tx = graphDb.beginTx(})}) 1 | 监 型 数值 
ea Pe userl.sgetProperty("year of birth", 1982); 为 整 至 数 便 
的 属性 为 USer2 .BetProperty("locked", true); < 设置 刷 扣 属性 
(字符 】 [> USer3 .SetProperty{("'cars owned", new String[] 141"BMW", "Audi"}); 为 击 泵 型 数值 
数组 tx SUucCcegss(): 
} 


我 们 已 经 通过 存储 节点 的 额外 信息 使 得 图 形 更 加 丰富 。 图 3-9 演 示 了 通过 对 程序 3-5 的 功能 做 了 增强 的 社交 网 络 (但 并 不 是 
程序 3-6 的 例子 ) 。 


IS FRIEND OF 


names: John Johnsaoan 


Jack Jeffries 


用 户 3 


name: Kate Smith 


全 


图 3-9 一 个 具有 多 种 属性 的 社交 网 络 图 形 


四 注意 


就 像 前 面 提 到 的 ，Neo4j 不 允许 null 必 性。 如 果 需 要 从 节点 上 删除 属性 ， 必 须 明 确 地 使 用 Neo4j 核 心 Java API: 


Node.temovePtopetty (String ptopettyName) ; 删除 。 


下 面 需 要 添加 几 个 用 尸 看 过 和 评级 过 的 电影 证 点 。 


3.2.4 ”节点 类 型 策略 


本 例 的 下 一 步 是 对 图 形 数据 库 添 加 电影 ， 用 于 用 户 进行 评级 。 我 们 将 按照 添加 用 户 的 同样 方式 添加 3 个 movie 节 点 。 下 面 的 


程序 3-7 演 示 了 如 何 使 用 Neo4j 核 心 Jjava API 添 加 代表 电影 的 节 氮 。 


【程序 3-7】 使 用 Neo4j 核 心 Java API 创 建 movie 节 点 


try _ (Transaction tx = graphDb.beginTx{()) I 
Node moVviel = this.graphDb.createNode!); 
moviel .setProperty('name", "Fargo"):; 
Node movie2 = this.graphDb.createNode |(); 
moviez2 .SetProperty("name", "Allen"l.; 
Node movie3 = this.graphDb.createNode |); 
movie3,.setProperty ("name", "Heat")., 

tx .SUCCeSS 1) ; 


图 3-10 表 示 了 在 这 一 阶段 的 图 形 。 


name*: John Johnson 


name: Kate Smith 


IS FRIEND OF 


name: Jack Jef fries 


name*: Alien name: Heat 


图 3-10 ”具有 代表 用 户 和 电影 节点 的 图 形 数 据 库 


J 正如 在 图 3-10 中 能 够 看 到 的 ，user 和 movie 节 点 都 用 方 框 表示 。 对 于 Neo4j 数 据 库 ， 这 是 非常 重要 的 一 点 。 从 Neo4j 数 据 库 
的 角度 来 讲 ，user 节 点 和 movie 节 点 之 间 没 有 什么 不 同 。 在 Neo4j 中 ， 节 点 在 默认 情况 下 是 没有 类 型 的 。 确 定 领 域 模型 中 每 一 个 
节点 应 如 何 描述 是 开 友 者 应 考虑 的 问题 。 


在 Neo4j 1.9 及 以 下 版 本 中 ， 能 够 使 用 的 最 简单 的 策略 是 给 每 一 个 节点 添加 一 个 type 属 性 ， 用 属性 值 确定 节点 的 类 型 。 这 是 
在 其 他 NoSQL 数 据 库 技术 (例如 文件 数据 库 ) 中 被 广泛 使 用 的 一 个 策略 ， 因 为 这 个 策略 很 容易 理解 和 实施 。 从 Neo 笑 2.0 版 本 往 
后 ， 建 议 的 策略 是 利用 称 为 “标签 ”的 新 特性 ， 这 将 在 3.3 节 中 详细 介绍 。 现 在 ,我 们 将 从 兼容 Neo 笑 1.9 版 本 的 非 标 签 策 略 开 
始 。 


使 用 type 属 性 策略 包括 给 每 一 个 节点 添加 一 个 type 属 性 ， 就 像 以 前 给 所 有 的 节点 添加 name 属 性 一 样 。 


【程序 3-8】 ”添加 type 属 性 以 确定 节点 类 型 


try (Transgaction tx = graphDb.beginTx{)}) 1 
userl .setProperty("'type"™, "User™).; 
User2.gsetProperty("'type", "User").; 


USEer3 .setProperty('type", ‘User").; 
moviel.setPropertyt"type", "Movie").; 为 所 有 的 申 影 节点 设 署 


moOvie2.,.SetProperty(l"type", "Movie"™).; 


tpe 属性 的 值 为 “Mowie 
moOvie3 .setPropertyt("type", "Movie").; 


tx., SuCcess(}): 


像 以 前 所 有 的 例子 一 样 ， 所 有 图 形 数据 库 的 操作 必须 包 妆 在 try 事 务 处 理 代 码 块 中 。 


有 了 节点 的 类 型 ， 现 在 可 以 简单 地 检查 忆 点 的 属性 值 以 确定 书 点 的 类 型 。 


} 4 | 了 本 是 mm 市 上 帅 . . ) 
} 


if ("User".equals (node .getProperty ("type"))) | 
//( 这 是 一 个 用 户 ) 
四 注意 


使 用 该 方法 ， 可 以 通过 属性 并 使 用 索引 找到 给 定 类 型 的 所 有 节点 (例如 所 有 的 电影 ) ， 这 将 在 第 5 章 中 详细 介绍 。 
图 3-11 展 示 了 对 每 一 个 节点 设置 了 type 属 性 的 图 形 数 据 库 。 


本 例子 到 这 里 已 经 基本 完成 了 ， 剩 下 的 工作 融 是 创建 从 用 户 到 用 户 喜 欢 的 电影 之 间 的 天 系 了 。 
3.2.5 ”为 天 系 添加 属性 


要 使 得 这 个 社交 网 络 的 图 形 数据 库 完 整 ， 只 需要 给 用 户 和 用 户 给 电影 的 评级 乙 间 添加 天 系 ( 称 为 HAS_ SEEN) 即 可 。 
HAS_SEEN 关 系 将 从 user 节 点 开始 直接 到 movie 节 点 ， 与 以 前 用 过 的 IS_FRIEND_OF 关 系 是 一 样 的 。 


name: John Johnson 
type: User 


Kate Smith 
[Jer 


\ IS FRIEND OF 


name: Jack Jeffriesa 


tvpe: User 


Fr 


A 


name: Fargqo name: Allen 


type: Movie 


name: Heat 
type: Movie 


type: Movie 


图 3-11 使 用 类 型 属性 策略 的 节点 


在 HAS SEEN 和 IS _ FRIEND _ OF 关系 之 间 有 一 个 重要 的 区 别 : HAS SEEN 关 系 包含 用 户 喜欢 电影 的 程度 的 额外 信息 (以 用 户 
给 


影评 级 的 星 的 数量 表示 ) 。 因 此 星 的 数量 不 是 user 节 点 或 movie 节 点 的 属性 (因为 一 个 用 户 可 以 为 多 部 电影 评级 ) 。 我 们 已 
经 基 道 如 何 给 节点 添加 属性 ， 但 是 给 关系 添加 属性 ， 到 目前 为 止 还 是 一 个 新 的 概念 。 


前 面 提 a 到 Neo 和 是 一 个 属性 图 形 。 在 Neo 笑 中， 属性 图 形 适 应 于 所 有 的 图 形 实体 一 一 天 系 以 及 节操 。 在 Neo 活 中 给 天 系 添加 
属性 残 像 给 节 点 添加 属性 一 样 简 单 。 我 们 将 引导 你 通过 使 用 Neo4j 核 心 Java API 为 天 系 添加 属性 。 


在 继续 往 下 进行 之 前 ， 需 要 给 这 个 枚 举 类 关系 添加 一 个 关系 类 型 。 以 下 程序 给 出 了 具有 新 的 HAS_SEEN 天 系 的 更 新 的 


MyRelationshipTypes 枚 举 。 


public enum MyRelationshipTypes implements RelationshipTypel 
IS FRIEND OF, 
HAS SEEN; 


下 一 步 是 创建 节操 之 间 的 命名 关系 ， 这 可 以 用 本 章 前 面 在 用 户 之 间 添 加 朋友 关系 的 方法 实现 。 创 建 天 系 的 APl 调 用 将 会 返回 
Neo4j 的 Relationship 对 象 ， 并 且 可 以 通过 调用 Relationship.set-Property (String name，Object value) 方法 使 用 它 。 


程序 3-9 给 出 了 创建 HAS_SEEN 关 系 并 添加 stars 属 性 的 代码 。 


【程序 3-9】 ”创建 具有 属性 的 关系 


try (Transaction tx = graphDb .beginTx(}) 1 
Relationship rell = 


忆 本 - 
userl.createRelationshipTo {moviel, www SEEMN 大 苏 ， 
MyRelationshipTypes.HAS SEEN).; 调用 API 返回 关系 对 训 


rell,setProperty ("stars", 5); . 
Relationghip rel2 = 和 前 一 行 便 建 的 式 系 
UsSer2. CreateRelationshipTo (movie3, 
MyRelationshipTypes.HAS SEEN).; 
rel2.setProperty(l"stars", 了 3) 
Relationship rel3 = 
usSer3.createRelationshipTo (moviel, 
MyRelationshipTypes .HAS SEEN).; 
rel3,.setProperty ("stargsg, 4).; 
Relationship reld4 = 
USEer3 .CreateRelationshipTo (moviesz, 
MyRelationshipTypes.HAS SEEN)., 
Tel4.SetPropertyl "gstargs; 35).; 


tx .SUCCess():; 


一 旦 为 图 形 添加 上 了 HAS SEEN 关 系 ， 最 终 束 用 Neo4 核 心 Java API 完 成 了 这 个 社交 了 网络 。 图 3-12 显 示 了 具有 所 有 节点 、 天 
系 和 属性 的 最 终 图 形 结构 。 


Kate Smith 
[SEer 


name*: John Johnson 


type: User 


IS FRIEND OF 


| \ 
RS SEEN | . i \ HAS SEER 
HS SE | name: Jack Jeffries SS SPR 
和 过 Pe CL, ] [= 本 
与 上 | type: [er I \ es | 可 上 所 9 马 
1 
{ 
| - Fe me i ' i, | Fe | ” ‘ 
下 HAS SEEN A '， HAS _ SEEN 上 
/| stars: 站 A \ stars: 5 
A ' 1 
er \ 
~. 4 
三 本 


人 二 TiE* Heat 
tvype: Movie 


Re 
name: Allien 


name: Fargo 
type: Movie 


人 


type: Movie 


图 3-12 ”电影 爱好 者 社交 网 络 的 完整 模型 


图 3-12 与 图 3-6 是 一 样 的， 我 们 已 经 设法 在 Neo 笑 图 形 数 据 库 中 用 Neo 和 核心 Java API 创 建 了 同一 个 图 形 。 


3.3 蔬 岂 标签 
在 前 面 的 几 节 中 ， 我 们 提 到 了 Neo4j 数 据 库 中 的 节点 没有 类 型 一 一 它们 仪 仪 是 一 些 “ 方 框 ”。 为 了 区 分 movie 节 点 和 user 节 
上 ， 我 们 为 每 一 个 节点 添加 了 属性 类 型 及 相应 的 数值 。 


AMS/ 


在 2.0 版 本 中 ，Neo4j 引 进 了 (内置) 节操 标 签 的 概念 ， 帮 助 我 们 分 组 相似 的 节操 。 节 点 标签 与 先前 讨论 过 的 关系 类 


非常 相似 。 
每 一 个 节点 可 以 有 一 个 或 多 个 文字 摘 述 ， 它 称 为 节操 标签 。 具 有 同样 标签 的 节点 用 一 种 专用 的 方式 存储 ， 因 此 它们 
组 并 可 以 一 起 使 用 。Neo4j 文 持 下 列 来 目 核 Java API 且 与 标签 相关 的 操作 : 通过 标签 加 载 所 有 的 节点 和 通过 标签 及 属性 查找 标 


能 分 为 一 


签 。 模 式 达 引 也 是 通过 标签 定义 的 。 


全 注意 
标签 也 可 以 在 Cypher 查 询 中 用 于 节点 查找 操作 。 标 签 的 这 种 用 法 将 在 第 6 章 中 讨论 。 


正 像 在 关系 类 型 中 ， 节 点 标签 是 用 单个 方法 String name () 在 一 个 简单 的 界面 中 定义 的 。 


public interface Label | 
Java. Lang .string name()., 


要 创建 一 个 标签 ， 可 以 简单 地 实现 这 种 接口 ， 或 者 像 天 系 类 型 一 样 ， 使 用 Java 枚 举 习 语 ， 满 足 Lable 接 口 的 约束 。 


public enum MyLabels implements Labell 
MOVIES, USERS 


程序 3-10 演 示 了 如 何 使 用 Neo4 Java API 创 建 标 签 。 


【程序 3-10】 ”给 书 点 添加 标签 


try (Transaction tx = graphDb.beginTx()}) 1{ 
moviel .addLabel MyLabels.MOVIE).; < 证 渤 此 的: 
movie2 .addLabel (MyLabels .MOVIE) |; PF 
movie3.addLabel (MyLabels.MOVIE).: 


i 下 】 
CA, SUCCeEBSl) } 


Resourcelterable<Node> bd -- 查找 具有 MOVIB 
GlobalGraphOperaticons .at (graphDb) 标签 的 所 有 苇 占 
.getAllNodesWithLabel (MyLabels .MOVIE).; < 人 


要 添加 标签 ， 应 该 对 选 定 的 节点 使 用 addLabel () 方法 (@) 。 为 了 查找 所 有 具有 给 定 标签 的 节点 ， 可 以 在 
GlobalGraphOperations 类 上 使 用 静态 的 getAlINodesWithLabel (Label label) 方法 (@)， 


图 3-13 是 添加 了 标签 的 图 形 。 
四 注意 


在 本 例 中 ， 为 了 确定 哪个 节点 代表 电影 ， 用 节点 标签 取代 了 类 型 属性 ， 因 此 ， 可 以 删除 二 者 中 的 任何 一 个 。 只 要 可 能 ， 建 议 
使 用 标签 ， 因 为 这 是 Neo4j 数 据 库 的 一 个 内 置 功 能 ， 这 个 功能 给 予 了 查询 和 基于 模式 索引 的 极 大 灵活 性 。 


IS FRIEND OF 


name: John Johnson Kate Smith 


type: User User 


IS FRIEND OF 


name* Jack Jeffries 
tvype: User 


name: Heat 


type: Movie 


name: Alien 
type: Movie 


name: Fargo 
Mow1ie 


type: 


图 3-13 ”用 MOVIE 标 签 分 组 所 有 电影 节点 


除 查 找 具 有 给 定 标签 的 所 有 市 点 以 外 ，Neo 笑 核心 Java APIl 具 有 查找 具有 给 定 标签 和 属性 的 所 有 节点 的 操作 ， 如 程序 3-11 所 


不 o 
【程序 3-11】 ”查找 给 定 标签 和 属性 的 节点 


查找 所 有 具有 MOVIE 标签 并 具 
RescuzceIEerable<Node> movies -= 有 省 字 “Fargo ”的 节点 
GlobalGraphoOperations.at IgraphDb) 
.findNodesByLabelAndProperty (MyLabelese.MOVIE, "name", "Fargo").:; 


泌 通 过 标签 和 属性 查找 节点 是 以 蛮 力 执行 的 (通过 循环 查找 所 有 具有 给 定 标签 的 节操 ， 并 比较 需 
擎 将 会 使 用 更 快 的 索引 碍 找 。 使 用 模式 系 引 将 人 在 第 ? 章 中 


在 默认 情况 下 ，Neo4j5 
的 属性 名 和 值 ) 。 但 是 ， 如 果 对 标签 和 属性 定义 了 模式 系 引 ，Neo443 


过 论 。 


四 注意 


正如 你 在 程序 3-10 中 所 看 到 的 ， 寻 找 所 有 具有 给 定 标签 的 节点 是 对 图 形 的 全 局 操作 【〈 正 像 设 计 的 那样 ， 可 以 获取 图 形 的 大 部 
分 ) ， 这 个 操作 可 以 通过 GlobalGraphO 〇 Operations 类 实现 。 另 一 方面 ， 通 过 标签 和 属性 找到 的 所 有 节点 (程序 3-11) ， 用 


GraphDatabaseService 接 口交 互 ， 为 只 期 望 返 回 图 形 中 的 小 部 分 节点 。 


标签 是 Neo 御 的 一 个 很 好 的 补充 ， 不 仅 仪 是 一 个 分 类 的 策略 。 因 为 书 点 可 以 有 多 个 标签 ， 所 以 可 以 创建 标签 把 经 常 一 起 使 用 
的 节点 分 组 (即使 不 同 的 类 型 也 可 以 ) ， 从 而 不 必 使 用 属性 。 例 如 ，RED_THINGS (对 所 有 红色 的 节操 ) 、FLYING (对 所 有 代 


表 能 飞 的 节点 ) 等 。 


一 一 
3.4 ”本 普 小 结 
在 3.1 节 ， 我 们 演示 了 如 何 建 模 社 交 网 络 中 电影 爱好 者 需求 的 一 个 例子 。 可 以 用 一 系列 图 表 作 为 需求 的 模型 ， 或 者 说 是 一 个 
虚拟 的 和 白板， 就 像 在 软件 开发 过 程 中 使 用 的 方法 一 样 。 
在 3.2 节 ， 我 们 逐步 演示 了 如 何 使 用 Neo4j 核 心 JavaAPI 对 同一 个 图 形 模 型 建立 Neo4j 图 形 数 据 库 。 


有 趣 的 是 两 组 步骤 看 上 去 几乎 一 样 ， 就 像 是 用 自然 的 方式 画图 来 描述 图 形 ， 以 便 人 类 的 理解 ，Neo4j 核 心 JavaAPI 可 以 使 我 们 
遵循 同样 的 模式 用 代码 描述 图 形 。 使 用 图 形 的 自然 语言 ， 使 用 Neo4j 核 心 JavgaAPI， 不 需要 其 他 的 任何 工具 或 框架 ， 即 不 需要 映射 


或 翻译 工具 ， 就 可 以 实现 设计 。 


图 形 确实 具有 非常 强大 的 结构 ， 我 们 在 日 常生 活 中 用 它 来 可 视 化 模型 并 解决 与 软件 工程 相关 的 问题 。Neo4j 也 可 以 让 我 们 使 
用 清晰 和 简单 的 图 形 作为 编程 的 模型 ， 把 软件 设计 和 需求 分 析 简单 容易 地 转换 成 模型 。 


在 本 章 中 ， 我 们 揭 开 了 Neo4j 核 心 Java API 的 面纱 ， 展 示 了 如 何在 图 形 中 建立 节点 、 用 关系 连接 节点 和 用 属性 描述 节点 和 关 
系 。 下 一 章 将 讨论 如 何 使 用 图 形 的 强大 功能 进行 数据 查询 。 


第 4 章 ”强大 的 图 形 疡 历 功 能 


本 草包 括 以 下 内 容 : 
: 使 用 核心 Java API 查 询 Neo4j 数 据 库 
“ 应 用 Neo4j 的 遍历 API 遍 历 节 点 和 关系 
. 扩展 和 定制 Neo4j 的 内 置 遍历 操作 


第 3 草 介绍 了 Neo4D 核 心 Java API 和 创建 了 代表 用 尸 和 他 们 喜欢 的 电影 的 社交 网 络 。 本 草 将 讨论 图 形 遍 历 一 一 查询 图 形 数据 
的 一 种 强大 功能 。 图 形 疡 历 是 以 一 种 特殊 的 方式 在 图 形 中 按照 节点 之 间 的 关系 访问 节点 的 过 程 。 


我 们 将 通过 解决 简单 的 刀 历 问题 的 示例 来 演示 塌 历 选项 ， 并 接着 介绍 几 个 更 为 复杂 的 例子 。 在 本 章 中 ， 你 将 会 更 加 熟悉 
Neo4j 核 上 Java API 以 及 具有 更 先进 的 Neo4D 声 历 框架 的 Java API (或 简称 为 Neo4 亿 历 AP1) 。 


让 我 们 从 最 简单 的 饥 历 开始 ， 从 起 始 忆 后 开始 按照 天 系 使 用 Neo4 核 心 Java API 查找 直接 的 邻居 。 


4.1 ”使 用 Neo4 核 心 Java APl 进 行 遍 历 
我 们 将 讨论 的 第 一 种 遍历 方法 是 使 用 Neo 有 4 核心 Java_ API 提 供 的 标准 方法 。 这 里 将 使 用 在 第 3 章 中 创建 的 图 形 数据 库 做 遍 
历 。 


第 一 次 饥 历 可 以 摘 述 为 “从 代表 用 户 John Johnson 的 书 点 开始 ， 查 找 这 个 用 户 看 过 的 所 有 电影 ”。 图 4-1 展 示 了 我 们 感 兴 
趣 的 这 个 图 形 的 一 部 分 。 


= hs = 
= | | | 
ER Et 


, IS FRIEND OF 
name* John Johnson 一 一 name*: Kate Smith 


type: User | type: User 


\ 
IAS SEEN er " HAS SEEN 
七 下 下 丰 


了 -一 所 1 
\ HAS SEEN \ 
pe \ stars: 5 人 
\ 
, 和 
大 me 
| | 
Fardo pir name: Allen name: Heat 
MOWIE = type: Movlie type: Movie 


| : | 


图 4-1 ”选择 的 用 户 和 他 看 过 的 电影 (用 加 粗 的 边框 标记 ) 


要 导航 到 代表 John 已 经 看 过 的 电影 的 节点 ， 我 们 将 从 代表 John Johnson 的 节点 开始 ， 然 后 按照 所 有 HAS_SEEN 关 系 找到 目 
标 电 影 。 我 们 要 访问 的 节点 和 关系 作为 般 历 的 部 分 用 加 粗 的 边框 做 出 了 标记 。 


第 一 个 任务 是 定位 遍历 的 起 始 世 点 : 用 户 John Johnson。 
4.1.1 寻找 起 始 节 点 


在 处 理 遍历 之 前 ， 我 们 需要 寻找 从 哪个 节点 开始 遍历 ， 它 通常 称 为 起 始 节点 。Neo4j 核 心 Java API 具 有 单个 查找 方法 ， 可 用 
于 从 图 形 数据 库 中 加 载 节 点 一 一 GraphDatabase Service.getNodeByld (Long id) 。 这 种 方法 通过 内 部 标识 签 加 载 节点 ， 在 


Neo4j 中 用 java.util.Long 数 字 表 示 。 我 们 假设 已 知 用 户 John Johnson 节 点 的 ID 且 ID 以 静态 变量 JOHN JOHNSON NODE ID 存 
储 的 。 
public static Long JOHN JOHNSON NODE ID = 3L; 沁 
private GraphDatabaseService graphdb:; | 
public void getJohnNode |() | 数据 库 中 加 载 闻 反 则 识 
return graphDb .getNodeById (JOHN JOHNSON NODE ID); 
} 


四 注意 


理想 情况 下 ， 我 们 将 基于 一 些 属性 值 而 不 是 节点 ID 寻找 起 始 节点 ， 例 如 ， 通 过 姓名 或 者 电子 邮件 地 址 找到 uset 节 点 。Neo4j 
的 临时 节点 查找 是 使 用 索引 执行 的 ， 这 将 在 第 5 章 中 详细 讨论 。 在 本 和 草 中 ， 节 点 的 查找 将 以 节点 的 ID 操作 。 


既然 已 经 有 了 起 始 节 点 ， 残 可 以 通过 帝 历 图 形 找到 感 兴趣 的 movie 证 后 。 


4.1.2” 历 直接 关系 


为 了 找到 John 已 经 看 过 的 所 有 电影 ， 首 先 要 加 载 John 节 点 ， 然 后 从 这 个 节点 开始 循 着 所 有 的 HAS_SEEN 关 系 查 找 ， 如 程序 
4-1 所 泵 。 


【程序 4-1】 ”从 起 始 节 点 开始 迭代 所 有 的 天 系 过 滤 电 影 


使 用 Node._get- 


try ‘Transaction tx = graphDb .beginTx()) { 加 寺 找 起 如 市 反 
Re Node userJohn = graphDb.getNodeById (JOHN JOHNSON NODE 1ID): 
全 或 终于 lterable<Relaticonship> allRelationships = userJohn.getRelationships'(); 
全 是 刷 扣 所 有 的 Set<Node»> moviesForJohn = new HaSshSet<MoaGe> ) | 
关系 for (Relationship r : allRelationships){ 使 用 典型 的 
if(r.getTypel) .name() .equalsIgnoreCase ("HAS SEENn) ) | 本 Java 循环 结 
Node movieNode = Ir.getEndNode'(); 
moviesForJohn.add (movieNode).; 移 选 代 所 
| 通过 检查 每 一 个 关系 类 型 有 关系 
| 过滤 HAS_SEEN 关系 
得到 关系 的 结束 for (Node movie : moviesForJohn)1 
泊 点 ， 该 节点 在 | odger.lnftol"User has seen moOVvle: " + movlie.gqetPropertyl"name"))}., 
bl Wk 在 控制 台 上 输出 
电 闵 | 结果 车 点 


四 注意 


回忆 一 下 ， 第 3 章 中 讲 的 所 有 Neo4j 操 作 (包括 从 Neo4j 2.0 及 以 上 版 本 的 读 操作 ) 都 需要 包装 到 一 个 事务 中 。 程 序 4-1 包 含 了 
这 个 最 初 的 样板 包装 代码 ， 但 是 ， 我 们 将 在 以 后 的 程序 中 将 其 删除 ， 以 减少 混乱 ， 并 将 重点 放 在 讨论 API 核 心 问题 。 然 而 ， 不 要 
已 记 程 序 没 有 它 是 不 能 运行 的 。 


在 程序 4-1 中 ， 使 用 Node.getRelationships () 方法 以 获得 始 于 或 终于 给 定 节点 的 所 有 关系 (人 @) 。 这 个 方法 返回 了 一 个 
java.lang.lterable 对 象 ， 该 对 象 包含 org.neo4j.graphdb.Relationship 实 例 ， 它 可 以 用 典型 的 Java 方 法 通过 for 循 环 迭 代 (@ 
) 。userJohn.getRelationships () 方法 将 返回 起 始 和 终止 于 起 始 节 点 的 所 有 关系 ， 包 括 并 不 感 兴趣 的 IS_ FRIEND_OF 关 系 
(参见 图 4-1) 。 要 识别 仅仅 是 感 兴趣 的 HAS_SEEN 类 型 的 关系 ， 需 要 在 循环 内 检查 每 一 个 关系 的 名 字 ( 合 ) 。 


要 得 到 与 关系 相关 的 节点 ， Ce getstartNode () ， 返 回 天 系 的 起 始 

节点 ; getEndNode () ， 返 回 关系 的 终止 节点 。 前 面 提 到 Neo4j 融 入 了 一 个 直接 属性 图 形 模型 用 以 存储 基本 图 形 。Neo4j 中 的 

每 一 个 关系 都 是 直接 的 关系 (从 起 始 节 点 到 终止 节点 ) 。 例 如 ，HAS_ SEEN 关系 总 是 从 user 节 点 到 movie 节 点 。 因 此 ， 起 始 节 
总 是 代表 用 户 ， 而 终止 节点 总 是 代表 电影 。 


节点 


在 程序 4-1 中 ， 这 正 是 如 何 找到 John 已 经 看 过 的 电影 的 : 而 电影 忌 是 HAS_SEEN 关 系 的 终止 节点 ， 因 此 ， 通 过 调用 
Relationship.getEndNode () 方法 得 到 一 个 对 它 的 引用 (@) 。 


四 注意 


尽管 所 有 的 关系 都 是 直接 关系 ， 但 是 实际 的 遍历 可 以 任意 选择 


沿 着 关系 往 上 或 往 下 。 


当 程 序 4-1 运 行 时 ， 程 序 运 行 结果 如 下 : 


User has seen movie: Fargo 


基于 图 4-1 中 的 图 形 ， 程 序 运行 的 结果 是 正确 的 。 用 Neo4j 核 心 Java API 对 图 形 数 据 库 做 了 一 个 查询 操作 。 


四 注意 


Node.getRelationships () 方法 不 能 保证 遍历 关系 的 顺 友 。 在 本 例子 中 ， 电 影 的 顺序 不 重要 ,但 是 如 果 需 要 排序 的 结果 ， 就 作 
须 遍 历 完 了 再 做 一 次 排序 。 


在 前 面 的 例子 中 ， 从 代表 用 户 John Johnson 的 节点 开始 ， 通 过 逐一 检查 与 起 始 节 后 相 连 的 天 系 的 名 字 过 滤 感 兴趣 的 关系 。 
用 名 字 过 滤 天 系 是 图 形 遍 历 的 一 个 非 营 音 用 的 方法 ，Neo4j 提 供 了 一 个 方便 使 用 的 专用 API， 因 此 ， 程 序 代 码 中 不 必 重 复 书 写 if 
语句 检查 天 系 的 类 型 。 程 序 4-2 给 出 了 使 用 Neo4 内 置 功 能 改进 的 程序 代码 。 

【程序 4-2】 使 用 Neo4j 核 Java API 的 过 滤 功 能 过 滤 电 影 


4 


使 用 Node_get- 


Relationships- Node userJohn = graphDb .getNodeById {JOHN JOHNSON NODE ID).; 
ry Iterable<Relationship> allHasSeenRelationships = 
2 和 usgerJohn.getRelationships (DynamicRelationshipType .withName ("HAS SEEN")).; 
Type) 方法 获得 具 Set<Node>s moviesForJohn = new HashSet<Node»>().; 
有 给 是 闫 型 【起 始 或 for (Relationship r : allHasSeenRelationshipes) | 
结 止 于 纵 定 节 点 ) 的 Node movieNode = r.getEndNode'(); 
所 有 美 素 moOoviesForUser .add lmovieNode).; 

| 

for(Node movie : moviesForJohn)! 

logger.infol(l"User has seen movie: "+ movie.getProperty("name")).,; 
| 


正 像 所 能 看 到 的 一 样 ， 代 码 中 并 没有 以 前 用 过 的 通过 需求 类 型 过 滤 天 系 的 if 语句 ， 这 使 代码 更 可 读 和 简洁 ， 并 给 出 了 与 以 前 
一 样 的 结果 。 


UgSer has Seen mMOV1e: Fargo 


如 果 你 需要 非 党 具体 的 结果 ，Neo4j 核 心 Java API 可 以 过 滤 除 关系 类 型 外 的 关系 说 明 ， 加 载 从 起 始 user 书 点 向 外 的 
HAS_SEEN 关 系 ， 可 以 使 用 下 面 的 程序 。 


lterable<Relationship» allOutgqoingHasSeenRelationships = 
UserJohn.,.getRelationships Direction. OUTSGOING, 
DvynamlicRelationshipType .withName ("HAS SEEN"))., 


如 上 所 示 ， 这 段 代 码 是 用 Neo4j 核 心 Jjava APl 更 高 级 的 过 滤 功 能 改进 的 程序 代码 。 但 是 这 是 一 个 非常 简单 的 刀 历 ， 仪 仅 查 看 
选 定 节 点 的 直接 相 邻 节点 。 在 下 一 书 中 ， 你 将 忆 历 越过 节 点 的 直接 邻居 以 确定 John 的 朋友 喜欢 什么 电影 


尿 I。 


4.1.3 ” 志 历 深度 为 2 的 天 系 


让 我 们 把 这 个 例子 推广 到 下 一 个 水 平 并 实现 一 个 简单 的 推荐 引擎 ， 用 以 得 找 John 的 朋友 喜欢 而 John 还 没有 看 过 此 


图 4-2 中 ，John 有 两 个 朋友 ，Jack 和 Kate。Jack 看 过 Fargo 和 Alien，Kate 看 过 Heat。 但 是 John 早 已 经 看 过 Fargo， 因 此 我 
们 和 希望 从 饥 历 获得 两 部 电影 : Alien 和 Heat。 图 4-2 显 示 了 遍历 过 程 中 必须 访问 的 节点 和 关系 。 


起 如 站 7 


JS FRIEND OF , 
Jonn Johnson | a ee | name: Kate smitn 
User | type: User 虹 
Js FRIEND OF 


HAS [Pee -SE EN 
gtars: + 


HAS SEEN 
Stars: 刁 


name: Fargo rd name: Allen name: Heat 


type;: Movie ss type: Mowvie | type: Movie 


图 4-2 为 了 查找 John 的 朋友 总 欢 的 电影 遍历 的 节点 和 关系 


为 了 解决 这 个 问题 ,我们 将 把 它 分 解 为 几 步 。 首 先 ， 我 们 从 起 始 证 点 开始 按照 IS_FRIEND_OF 关 系 查找 John 的 所 有 朋友 。 其 
次 ， 从 代表 朋友 的 节操 开始 沿 着 HAS_SEEN 关 系 查找 他 们 已 经 看 过 的 电影 。 程 序 4-3 给 出 了 这 两 步 的 具体 过 程 ， 表 一 次 简单 地 使 
用 了 Neo4j 核 心 Java APl。 


【程序 4-3】 ”查找 John 的 朋友 已 经 看 过 的 电影 


| 时 雪 志 到 Node userJohn = graphDb .getNodeById (JOHN JOHNSON NODE ID), 

从 藉 系 得 到 

John 的 朋友 Set<Node> friends = new HaSsbhoSet<Noae> 1) 

en for (Relationship r1 : 生 到 代 所 有 的 
userJohn.getRelationships{(IS FRIEND OF})) | 1S FRIRND OF 关系 

Node friend = rl.getotherNode (UserJohn}:; 


py friends,add lfriend): 
, | 人 谋 代 先 训 存 癸 
性 朋 允 在 恨 ei + 
pe Set<Node> moviesFriendsLike = new HashSet<Node»>().; 的 朋友 六 点 
村 局 况 蛮 . | 1 
在 局 部 变量 for(Node friend : friends)'1 


friend.getRelationships (Direction .OUTSOING, ， 进 代 回 灶 的 


中 以 备 后 用 起 for (Relationship r : : 多 对 每 一 个 用 户 - 朋友 
HAS SEEN)) { HAS 9EEM 关 六 


moviesFriendsLike.addlir.getEndNodel)); < 
有 添加 电影 节 
) 点 到 集合 中 
for (Node movie : moviesFriendsLike) | 庄 屏 其 近 
logger.infol"Found movie: "™ + movie.getProperty("'name")); < 在 订 大 近 
| 制 台 输 出 
结果 


本 程序 的 第 一 部 分 (@Q、@、@) 用 局 部 变量 存储 了 John 的 朋友 。 首 先 ， 迭 代 从 起 点 开始 的 所 有 IS_ FRIEND OF 关系 ， 而 
不 考虑 方向 (@) 。 记 住 ， 尽 管 IS FRIEND OF 关系 具有 一 个 起 点 和 一 个 终点 ， 但 是 既 可 以 往 上 游 查 找 也 可 以 往 下 游 查找 朋友 关 


系 。 由 于 并 不 知道 John 是 人 否 是 关系 的 起 点 还 是 终点 ， 因 此 不 能 使 用 Relationship.getStartNode () 或 


Relationship.getEndNode () 方法 以 确定 关系 的 其 他 参与 者 。 盏 运 的 是 ，Neo4j 核 心 Java API 对 这 个 问题 有 一 个 解决 的 办 法 : 
Relationship.getOtherNode (Node node) 方法 。 给 定 天 系 的 一 病 ， 该 方法 整 给 出 天 系 的 男 一 端 。 在 这 种 情况 下 ， 因 为 知道 
关系 的 一 端 是 John 节 点 ， 所 以 可 以 利用 该 方法 查找 John 的 朋友 (@@) 。 最 后 ， 添 加 朋友 节点 到 java.lang.Set 局 部 变量 friends 中 


(从 ) ， 以 备 以 后 使 用 。 


在 本 程序 的 第 二 部 分 


7 (人 @、 介 、@) 找到 了 John 的 朋友 看 过 的 所 有 电影 。 对 每 一 个 存储 在 临时 局 部 变量 中 的 节点 (@) ， 


检查 所 有 向 外 的 HAS_SEEN 关 系 (全 ) 。 就 像 在 前 面 的 例子 中 一 样 ， 加 载 HAS_SEEN 的 终止 节点 (代表 一 部 电影 ) 并 作为 结果 将 
其 存 到 局 部 set 变 量 moviesFriendsLike 中 (@) 。 


最 后 ， 输 出 结果 到 控制 台 上 (人 @) ， 输 出 的 结果 如 下 : 


Foungd movie 


上 总 工 要 与 


FOUNnd moeoVvie: Allien 
FOUNd movie: Heat 


很 明显 ， 该 程序 有 错 的 地 方 ， 尽 管 John 的 朋友 已 看 过 这 三 部 电影 (Jack 看 了 Fargo 和 Alien，Kate 看 了 Heat) ， 因 为 John 看 
过 Fargo， 所 以 不 应 该 输出 Fargo。 


须 确保 在 输出 中 删除 John 看 过 的 电影 。 要 完成 这 项 工作 ， 需 要 找到 John 看 过 的 所 有 电影 ( 束 像 在 4.1.2 节 中 一 样 ) 并 从 结 
果 中 删除 。 程 序 4-4 给 出 了 完成 这 一 工作 的 一 种 方法 。 


【程序 4-4】 ”查找 John 的 朋友 已 经 看 过 但 John 没 有 看 过 的 电影 


Node userJohn = graphDb .getNodeById (JOHN JOHNSON NODE ID); 


Set<Nodes ir 


lends = new HashSet<Node>(): 


for (IRelationship rl 
usSerJohn.getRelationships (IS FRIEND OF})) 1 
Node friend = rl1.getotherNode (userJohn).; 
friends.addlifriend): 


} 


Set<Nodes moOVviesFrlendsLike = new HashSet<Nodes>():; 


for{Node friend 


friends) | 


for{‘Relationship r 
friend.getRelationships (Direction .OUTSGOING, HAS SEEMN) ) | 


moviesFriendsLike.addl{r.getEndNode{()}.; 
Set<aNodes moviesJohnLike = new HashSet<Nodes!().:; 
for (Relationship + : 和 查找 John 看 过 的 所 有 电影 
USerJoNnn.getRelatlionships (Direct1lion. OUTGOLING, 6 
HAS SEEN) ) 1 
moviesJohnLike.add lr.getEndNode ()). 
| 9 从 知 果 中 删除 John 
和 本 司 " 
moviesFriendsLike. removeAll (moviesJohnLike).; < 看 过 的 所 有 电影 


for (Node TOWVIE 


logger.infol 


| 


: moviesFriendsLike) 1 
"Found movie: " + movie.getProperty!("name")).,; 


现在 已 经 给 遍历 算法 添加 了 另外 的 一 个 步骤 。 首 先 查 找 John 已 经 看 过 那些 的 电影 (@) ， 然 后 应 用 标准 的 Java Collections 
API 从 原来 的 结果 集中 删除 John 看 过 的 电影 (@) 。 运 行程 序 4-4， 可 以 得 到 预期 的 结果 ， 即 两 部 电影 。 


FOUND meVvVvie: Al1len 


FOUNd movie: Heat 


最 终 有 了 类 似 一 个 简单 的 推荐 引擎 的 程序 代码 一 一 由 用 户 的 朋友 ， 而 不 是 用 户 推荐 已 经 看 过 的 电影 。 


让 我 们 回忆 一 下 这 个 例子 的 实现 过 程 。 用 一 个 简单 的 算法 ， 在 一 系列 的 步骤 中 实现 解决 方案 : 找到 所 有 朋友 ， 然 后 找到 朋友 
看 过 的 电影 ， 最 后 删除 用 户 看 过 的 电影 。 尽 管 程序 可 读 性 好 并 容易 理解 ， 但 存在 一 个 重大 缺陷 : 用 了 大 量 内 存 。 每 一 步 都 用 Java 
的 堆 空 间 在 局 部 变量 中 人 存储 了 中 间 结 果 。 当 处 理 少 量 用 户 和 电影 时 ， 这 不 是 个 问题 ， 但 是 数据 集 增 长 到 成 干 上 万 个 时 ， 运 行程 序 
很 可 能 出 现 可 怕 的 OutOfMemoryError 异 弟 。 在 本 例 中 这 不 是 一 个 值得 关注 的 问题 ， 因 为 忌 共有 三 个 用 尸 和 三 部 电影 。 现 在 到 
了 该 考虑 Neo4 是 如 何 处 理 大 的 贺 历 结果 的 时 间 了 。 


4.1.4 ”内 存 使 用 注意 事项 


已 经 看 到 Node.getRelationships (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 返回 了 一 个 lterable-<Relationship> 对 
象 。lterable 接 口 允许 在 Java 的 for 循 环 中 使 用 实现 类 ， 这 在 前 面 的 例子 中 已 经 出 现 过 几 次 。 在 Java 代 码 中 ， 有 许多 实现 lterable 
接口 的 例子 一 一 例如 ， 所 有 的 java.util.Collection 类 ， 像 java.util.Set 和 java.util.List 实 现 ， 以 及 java.util.Vector 和 和 
java.util.Stack。 但 是 Node.getRelationships (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 不 返回 任何 这 些 闭 名 的 类 。 它 们 返回 了 
Neo4j 的 lterable 实 现 ，org.neo4j.kernel.impl.util.Arraylntlterator 既 实现 了 Java lterable 接 口 ， 也 实现 了 Iterator 接 口 ， 并 且 
是 一 个 围绕 java.util.lterator 的 瘦 包 妆 类 。 人 在 对 结果 迭代 之 前 实际 上 还 没有 访问 结果 中 包含 的 元 素 。 这 一 实现 是 在 第 一 次 访问 时 
延迟 加 载 的 ， 一 旦 使 用 ， 融 不 能 再 次 使 用 一 盖 变 为 无 效 (这 是 Java 和 迭代 器 期 望 的 行为 ) 。 

当 使 用 Neo4j 核 心 Java API 时 ， 这 是 非常 重要 的 。lterable 接 口 允 许 Neo4 返 回 非常 大 的 数据 集 ， 开 友 者 负责 确保 以 正确 的 
方式 访问 数据 集中 的 元 素 。 就 像 我 们 说 过 的 ， 如 果 从 Neo4j 的 lterable 接 口 加 载 大 量 的 结果 到 你 自己 的 Java list 或 set 中 ， 必 须 意 
识 到 你 的 程序 代码 需要 大 量 的 Jave 扒 内 仔 ， 这 样 在 运行 程序 时 束 会 有 可 能 出 现 OutOfMemoryError 异 弟 。 这 惑 是 为 什么 尽 可 能 
在 程序 代码 中 使 用 lterable 接 口 被 认为 是 一 个 好 的 做 法 ， 而 不 是 将 其 转换 为 大 量 需要 内 存 结构 的 代码 。 


程序 4-5 展 示 了 一 个 解决 与 以 前 例子 一 样 问题 的 方案 一 一 查找 John 的 朋友 看 过 但 是 John 还 没有 看 的 电影 ， 但 是 这 一 次 仪 仪 
使 用 Java 的 for 循 环 结构 在 Neo4j 的 lterable 接 口 实现 ， 且 不 在 局 部 变量 中 消耗 不 必要 的 内 人 存 。 


【程序 4-5】 ”使 用 迁 代 接 口 降低 Java 堆 内 存 的 消耗 


Node userJohn = graphDb.getNodeById (JOHN JOHNSON NODE TD).; 


Set<Nodes moOVvVvIESFrF1IendsLike = new HashSsSet<Nodesl().: 

for (Relationship rl 
userJohn.getRelationships (IS FRIEND OF)) | 

Node friend = rl.getotherNode (userJohn).: 


fF or at 下 

friend.getRelationships (Direction,OUTGOING, HAS SEEN)) | 
Node movie = r2.9getEndNodel():; 
boolean JohnLikesiIt = talse,; 
for (Relationship r3 

movie.getRelationships (Direction.INCOMING, HAS SEEN)) 1 

jf {r3.getstartNodel(}) .equals(userJohn)) | 
ohnbLikesIt = true:; 


if (!johnLikesIt) { 
moviesFriendsLike,add limovie}: 


i 


for (Node movie : moviesFriendsLike) | 


上 


logger. info{"Found movie: " + movie.getProperty(l'"name")).; 


外 注意 


这 个 解决 方案 看 上 去 比较 好 ， 人 但是， 当面 对 有 用 户 看 过 的 几 百 万 部 电影 时 ， 存 在 一 个 潜在 的 瓶颈 (因为 在 每 一 次 循环 中 都 必 
须 检 查 John 是 否 已 经 看 过 ) 。 在 有 限 的 数据 集中 ， 这 不 会 有 什么 影响 ， 但 是 ， 必 须 指 出 的 是 ， 当 面 对 大 数据 集 时 ， 编 写 简单 的 代 


码 有 时 会 更 好 ， 即 使 多 写 一 点 也 没关系 。 在 本 例 中 ， 一 旦 往 前 查找 ， 就 会 找到 John 看 过 的 所 有 电影 ， 然 后 用 这 个 数据 集 在 for 循 环 
中 过 滤 电 影 。 


我 们 已 经 设法 重 构 了 解决 方案 ， 以 便 节 省 内 存 并 更 好 地 适应 潜在 的 大 数据 集 。 结 果 正 如 期 待 的 一 样 ， 因 此 方案 仍然 是 正确 
的 。 但 是 程序 4-5 仍 然 不 是 我 们 所 见 过 程序 中 最 好 的 。Neo4j 核 已 java API 多 许 我 们 访问 帮 层 Noe 圾 数据 结构 以 实现 需要 的 志 
历 ， 但 是 仓 在 付出 多 写 代 码 的 代价 并 担心 其 他 的 方面 (如 内 存 的 消耗 ) 。 玛 运 的 是 NeoD 配 备 了 一 个 高 精炼 的 APl， 可 以 满足 以 
简单 、 目 然 的 方式 摘 述 所 历 的 需求 。 在 下 一 节 中 ， 我 们 将 用 Neo4j 遍 历 API 进 一 步 重 构思 历 解决 方案 。 


4.2 ”使 用 Neo4 的 所 历 AP 进行 遍历 


我 们 已 经 使 用 Neo4j 核 心 java API 实 现 了 一 个 推荐 引擎 ， 它 允许 我 们 使 用 底层 的 Neo4j 数 据 结 构 获得 我 们 的 目标 。 在 本 节 
中 ， 我 们 将 使 用 更 具有 流畅 性 和 表达 性 的 Neo4 遍 历 API 改 进 这 个 解决 方案 。 


4.2.1 使 用 Neo4j 的 内 置 志 历 结 构 


Neo4j 志 历 AP 是 一 个 具有 流 畅 创建 器 API 且 基于 回调 函数 的 框架 ， 它 允许 你 在 一 行 代码 中 以 可 表达 的 方式 创建 志 历 规则 。 
遍历 API 的 主要 部 分 是 org.neo4j.graphdb.traversal.TraversalDescription 接 口 ， 它 定义 了 创建 器 的 方法 用 于 描述 遍历 器 行为 。 
你 可 以 将 遍历 比 作 一 个 机 器 人 ， 按 照 一 组 定义 好 的 媚 历 顺序 规则 和 跟 趴 关系 、 在 结果 中 需要 包含 的 天 系 和 节操 等 ， 通 过 关系 从 一 
个 节 氮 跳 路 到 男 一 个 节点 。Traversal Description ( 允 历 摘 述 ) 是 一 个 不 可 变 的 对 象 ， 用 于 定义 刀 历 规则 。 添 加 任何 新 的 饥 历 规 
则 (在 TraversalDescription 接 口中 调用 创建 器 万 法 中 的 任何 一 个 ) 思 是 返回 新 的 TraversalDescription 实 例 。 


为 了 演示 Neo4j 思 历 API 是 如 何 工作 的 ， 让 我 们 使 用 Neo4j 贺 历 API 重 构 志 历 。 在 程序 4-6 中 ， 返 回 了 John 的 朋友 看 过 的 电影 
的 贺 历 已 经 实现 ， 但 没有 删除 John 本 人 看 过 的 电影 。 


【程序 4-6】 ”使 用 Neo4j 志 历 API 碍 找 朋友 看 过 的 电影 


4 本 下 四 = 和] 和 RD "Ey RJT 
历 猫 述 Node userJohn = graphDb.getNodeById (JOHN JOHNSON NODE ID) ; 添加 IS_FRIEND_OF 
交 蕴 到 跟 野 的 区 委 
TraversalDescription traversalMoviesFrliendsLike = EE 
Traversal .descriptionl) i 
y crip |) 设置 唯一 性 使 
添加 HaS SEEN .relatlionships (1S FRIEND OF) Ey 外 果 中 每 一 小 
i 和 UE ny h | | | | Ps 本 用 -HH 是 了 | 
关系 到 跟踪 的 .relationships (HAS SEEN, Direction.OUTSGOING) 上 旦 也 , 
人 i . Ee ee | 
关系 中 .UNnioquenese Unlioqueness.NODE GLOBAL) 中 司 正 瞧 , 
让 | 二 Fe 3 
.是 Waluaat or ‘(Byalatorn | atDeptn (2 ， Ed 设置 评估 冰 狼 
> Traverser traverser = traversalMoviesFriendsLike.traverse (UsSerJohn);} 二 话 员 后 涯 麻 ， 
= 和 
从 代表 用 户 Iterable<cNode» moviesFriendsLike = traverser.nodes'l). ] , 
, 处 的 市 后 匹配 
John 的 节操 oe , 
i 所 foar (Node movie : moviesFriendesLike) 1 
thi Es 
这 | A -2 庆 Er 了 L UD py 至 肯 i 
i logger.info(l"Found movie: ”+ movie.getProperty("name")}; | 获得 所 有 访问 这 
的 节点 作为 结果 


Neo4j 提 供 了 一 个 默认 的 TraversalDescription 接 口 实现 ， 它 可 以 用 静态 方法 Traversal.description () 实例 化 (@) 。 由 
于 很 少 需 要 自己 提供 这 个 实现 ， 因 此 ， 通 常 从 此 开始 创建 TraversalDescription。 下 一 步 定义 遍历 中 的 要 包含 关系 ( 包 、 自 
) ，TraversalDescription 维 护 使 用 TraversalDescription.relationships (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 添加 的 关系 列表 ， 并 且 只 有 在 这 个 列表 中 
包含 的 关系 才能 被 亿 历 。 可 以 添加 关系 类 型 而 不 必 指 定 方 向 ， 在 这 种 情况 下 ， 两 个 方向 都 可 以 查找 ,或 者 也 可 以 定义 一 个 相对 于 
起 始 节点 的 查找 方向 (全 ) 。 


在 下 一 行 指定 遍历 器 如 何 处 理 在 遍历 期 间 遇 到 的 节点 和 关系 的 唯一 性 。 我 们 期 望 每 一 个 节点 恰好 访问 一 次 ， 因 此 ,在 
Uniqueness.NODE GLOBAL (全 局 节点 唯一 性 ) 中 设置 唯一 性 (人 @) 。 例 如 ， 其 他 人 允许 的 值 是 Uniqueness.NODE PATH ( 节 
点 路 径 唯 一 性 ) ， 即 当 从 起 点 到 终点 的 路 径 是 唯一 的 时 候 ， 它 允许 妃 历 同一 个 节点 多 次 ; 而 
Uniqueness.RELATIONSHIP_GLOBAL (全 局 关系 唯一 性 ) 允许 遍历 每 一 个 关系 仪 仪 一 次 。 我 们 将 在 第 8 章 中 详细 介绍 唯一 性 值 
之 间 的 区 别 。 


最 后 ， 给 TraversalDescription 添 加 一 个 评估 函数 (Evaluator) ” (全) 。 评 估 函 数 负责 两 个 决策 (作为 Neo4j 遍 历 API 的 一 


部 分 ) : 
` 决定 正在 遍历 的 节点 是 否 添 加 到 遍历 的 结果 中 。 
` 决定 遍历 是 否 沿 着 当前 图 形 的 路 径 继 续 遍 历 下 去 ， 如 果 评 估 到 现在 的 路 径 应 该 放弃 ， 就 移动 到 下 一 个 路 径 (如 有 可 能 ) 。 


Neo4j 中 的 评估 国 数 是 由 org.neo4j.graphdb.traversal.Evaluator 接 口 定 义 的 ，Neo4j 提 供 了 大 量 可 供 使 用 的 方便 、 现 成 的 
实现 方法 。 这 些 方法 可 以 通过 org.neo4j.graphdb.traversal.Evaluator 类 中 的 静态 工厂 方法 访问 。 在 程序 4-6 中 使 用 了 
Evaluators.atDepth (int depth) 评估 了 消 数 ， 访 评估 消 数 仪 接受 指定 深度 上 的 所 有 节点 ， 并 从 起 始 节 点 计数 。 另 外 ， 该 评估 沙 


数 还 阻止 任何 超出 指定 深度 的 遍历 。 


Neo4j 提 供 的 其 他 有 用 的 评估 消 数 将 在 第 8 草 中 讨论 。 评 估 立 数 是 Neo4 和 遍历 API 的 重要 概念 ， 很 有 可 能 会 经 常 实现 自 定义 评 
估 国 数 。 在 下 一 节 中 ， 我 们 将 实现 一 个 自 定 义 Evaluator 接 口 。 


4.2.2 ”实现 一 个 目 定 义 评估 消 数 


现在 需要 改进 前 一 节 例 子 中 的 代码 以 从 结果 中 排除 John 看 过 的 电影 。 要 实现 这 个 目的 ， 需 要 给 遍历 描述 添加 新 的 规则 。 表 
面 提 到 Neo4 笑 的 评估 消 数 实现 定义 了 哪个 节点 保存 在 结果 中 和 哪个 节点 丢弃 。 另 外 ， 还 定义 了 什么 时 间 亿 历 完全 停止 。 基 于 这 一 
上 凡 ， 我 们 可 以 实现 另外 一 个 自 定义 评估 消 数 ， 用 以 排除 用 尸 已 经 看 过 的 电影 。 

Evaluator 接 口 定义 了 一 个 需要 实现 的 方法 public Evaluation evaluate (Path path) 。 这 个 方法 接受 
org.neo4j.graphdb.Path 类 型 的 单一 参数 ， 这 个 参数 代表 从 起 始 节 点 到 目前 节点 遍历 的 所 有 节点 和 关系 。 这 个 接口 定义 了 许多 
便利 的 方法 用 以 收集 有 天 志 历 当前 状态 的 信息 。 例 如 ， 志 历 的 所 有 节点 、 遇 历 的 所 有 关系 、 路 径 的 起 始 节点 和 路 径 的 终止 节 点 
等 。 表 4-1 列 出 了 Path 接 口 的 所 有 可 用 方法 。 


表 4-1 org.neo4j.eraphdb.Path 接 口中 定义 的 方法 


方法 签名 描 述 
Node StLartNoae1(y ， 了 路径 的 起 始 节 上 点， 不 要 与 关系 的 起 始 节点 混 靖 


路 征 的 经 止 斑 感 ， 表 有 历 当前 上 玉 后 ， 不 机 与 关系 的 如 
止 市 辐 混 清 


Relationship lastRelationship().; 遍历 的 最 后 关系 


Node endNode().: 


Iterable<Relationship> ee sa ee ea 
relationgships (); 按 遍 历 顺 序 ， 到 当前 节点 遍历 过 的 所 有 关系 


Tterable<Node> nodes () ， 按 遍 历 顺 序 ， 路 径 中 的 所 有 节点 
返回 中 生 的 长 度 ， 实 际 上 萄 是 下 有 历 过 的 节操 数 (或 
int Jenotht{}; pe 
音 是 节 上 局 数 汪 1) 


四 注意 


不 要 混 消 路 径 的 起 始 蔬 点 终止 节点 与 关系 的 起 始 节点 终止 节点 是 很 重要 的 。 关 系 的 起 始 与 终止 节点 依赖 于 关系 的 方向 。 路 径 
的 起 始 与 终止 节点 依赖 于 遍历 顺序 。 由 于 Neo4j 允 许 按 任意 方向 饥 历 关系 ， 这 对 不 太 热 悉 Neo4j 的 人 来 说 ， 有 时 很 容易 引起 混 消 。 


evaluate (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/..) 方法 能 够 返回 
org.neo4j.graphdb.traversal.Evaluation 类 型 ， 这 是 一 种 Java 枚 举 类 型 ， 具 有 四 种 可 能 的 值 。 基 于 返回 的 Evaluator， 遍 历 器 决 
定 是 停止 (Neo4j 术 语 为 修正 ) 还 是 继续 。 另 外 ， 返 回 的 Evaluator 值 用 以 确定 是 否 将 现在 的 节点 保存 在 结果 中 (包括 ) 还 是 于 
弃 (排除 ) 。 这 两 个 变量 的 结合 定义 了 Evaluator 枚 举 的 四 个 值 。 表 4-2 解 释 了 不 同 的 Evaluator 值 。 


表 4-2 ”Evaluator 枚 举 类 的 可 能 取 值 


方法 签名 拉 述 


INCLUDE AND CONTINUE 包括 结果 中 的 当前 节点 并 继续 遍历 

INCLUDE AND PRUNE 包括 结果 中 的 当前 节点 但 停止 本 路 径 的 继续 遍历 
EXCLUDE AND CONTINUE 去 径 当 前 节 所 并 继续 遇 爵 

EXCLUDE AND PRUNE 丢弃 当前 节点 并 停止 遍历 


现在 已 经 理解 了 Path 接 口 和 Evaluator 榴 举 ， 那 束 该 实现 一 个 目 定 义 评估 立 数 了 。 程 序 4-7 给 出 了 实现 的 代码 。 


【程序 4-7】 ” 目 定 义 评估 立 数 用 于 排除 用 己 看 过 的 电影 


构造 函数 中 public class CustomNodeFilteringEvaluator implements Evaluator { 类 实现 o rd _neddj. 
private final Node userNode,; , , 
为 评 司 销 数 graphdb. 
提供 的 起 始 让 public CustomNodeFilteringEvaluator (Node userNode) :{ rawrersal. 
用 户 消 点 this.userNode = USeErNode: ee 
| 
public Evaluation evaluate (Path path) 1 
如 果 当 前 上 Node currentNode = Path.endNode1) ; ” |] 得 到 访 历 中 当前 节点 的 引用 
ie = = - ; = i = | $i Hy i 
We . if (lcourrentNode.hasProperty ("type") | 
点 不 是 一 部 8 ) ) 
WR en IcurrentNode .getProperty("type") .equals ("Movie")}) 1 
电影 丢弃 > return Evaluation.EXCLUDE AND CONTINUE; 诵 讨 当前 电影 基点 所 
ms 并 外 六 } » , 
并 继续 。 | A 有 向 内 的 HAS_SEEN 
for (Relationship 工 A 关系 法 佛 
-对 广 定 
currentNode .getRelationships (Direction.INCOMING, HAS SEEN)) 1 从 
if lr.getstartNode() .equals (userNode)) | 
return Evaluation.EXCLUDE AND CONTINUE; < 和 如果 关 系 的 起 始 节 点 与 
i 用 户 节点 相同 ， 丢 弃 当 
a 至 
return Evaluation., INCLUDE AND CONTINUE; < 前 节 所 〈《 因 为 用 尸 已 经 
} 看 过 ) 并 继 经 
| 否则 当 御 时 中 的 
当前 市 后 wn 


现在 残 可 以 把 这 个 实现 的 目 定 义 评估 阔 数 包 合 于 一 个 志 历 定义 中 。 程 序 4-8 给 出 了 改进 的 志 历 定义 。 


【程序 4-8】 ”用 目 定 义 评 估 遂 数 改进 的 亿 历 定义 
Node userJohn = graphDb.getNodeById (JOHN JOHNSON NODE IDi ; 


TraversalDescription traversalMoviesFriendsLike = 


IEMA rE 8 存在 的 评 

.relationships (IS FRIEND OF) 生活 数 
.rTelationships (HAS SEEN, Direction .oOUTGOING) 是 数 仍 
,Uniqueness (Uniqueness .NODE GLOBAL) 然 在 用 
.evaluator (Evaluators.atDenoth (2)); 2 

自 定 义 函 站 :Evaluator (new CustomodeFilteringEvaluator (userdJohn))}).; 

半 加 到 这 TT 有 VEEESEE Xaverger 三 ee MoviesFriendsLike.traverse (userJohn). 

历 定义 中 Iterable<Node>» moviegsFriendsLike = traverser.nodes') 


for (Node movie : moviesrFriendsLike) | 
logger.info("Found movie: " + movie,.getProperty("name")). 


其 实 已 经 有 了 一 个 评估 函数 ， 这 个 评估 函数 仅 包含 深度 2 的 节点 (@) 。 最 好 是 不 要 删除 它 ， 只 把 新 的 加 进去 即 可 (@) 。 


在 Neo4j 志 历 API 中 ， 可 以 同时 建立 多 个 评估 国 数 ， 因 此 可 以 添加 多 个 评估 六 数 到 单个 遇 历 摘 述 (Travelsal Description) 中 。 


如 果 在 遍历 的 过 程 中 包含 多 个 评估 函数 ， 那 么 使 用 布尔 代数 : 对 包含 在 结果 中 的 当前 节点 ， 所 有 的 评估 函数 都 应 该 返回 带 一 个 


INCLUDE 元 素 (INCLUDE AND _ CONTINUE 或 INCLUDE AND PRUNE) 的 评估 值 。 类 似 地 ， 要 沿 着 同一 路 径 继续 往 下 遍 


历 ， 所 有 的 评估 水 数 都 要 返回 一 个 CONTINUE 评 估 立 数 (INCLUDE AND _ CONTINUE 或 EXCLUDE AND _ CONTINUE) 。 


如 果 以 同一 组 数据 运行 改进 的 应 用 ， 将 会 看 到 期 待 的 输出 。 


Faund meVvie: Al1en 


FOUNnd movie: Heat 


然而 ， 这 一 次 我 们 使 用 了 更 流畅 的 Neo 和 毅 历 API 并 设法 实现 了 一 个 更 具有 表现 力 的 解决 方案 。Neo4 笑 声 历 APl 具 有 一 个 声明 
特性 : 简单 地 声明 你 希望 如 何人 遍历 ， 然 后 按照 声明 开始 毅 历 。 如 果 你 使 用 的 是 Java API1， 我 们 建议 你 在 可 能 的 情况 下 使 用 Neo4j 
忆 历 器 API 框 架 遍 历 做 图 形 人 遍历 ， 因 为 Neo4D 刀 历 器 API 框 架 在 处 理 复杂 图 形声 历时 产生 可 读 的 、 可 维护 的 和 高 性 能 的 代码 。 


在 第 8 草 中 我 们 将 回 过 头 来 讨论 更 先进 的 遍历 概念 。 


4.3 ”本 童 小 结 


本 章 介 绍 了 人 遍历， 人 遍历 是 一 个 查询 相互 联系 的 数据 的 强 有 力 的 方法 ， 是 专 为 图 形 数据 库 而 设计 的 。 


4.1 节 介绍 了 如 何 使 用 Neo4j 核 心 Java API 遍 历 例子 中 的 图 形 数据 ， 找 到 了 用 户 的 朋友 看 过 的 所 有 电影 。 遍 历 图 形 时 ，Neo4j 核 
心 Java API 功 能 强大 并 且 灵 活性 好 ， 但 是 ， 对 于 复杂 的 遍历 ，Neo4j 核 心 JavaAPI 的 实现 将 很 快 变 得 复杂 起 来 。 

这 就 是 Neo4j 人 遍历 API 所 解决 的 问题 ， 是 在 4.2 节 中 讨论 的 。 使 用 流畅 的 Neo4j 人 遍历 API， 可 以 以 简单 的 声明 方式 描述 遍历 查 
询 ， 而 不 会 影响 任何 的 图 形 遍 历 功能 ， 并 使 性 能 的 影响 降 到 最 小 。 
些 


在 本 书 的 大 部 分 例子 中 ， 因 为 Neo4j 遍 历 API 的 流畅 性 和 可 读 性 ， 我 们 选择 Neo4j 遍 历 API。 但 是 在 一 些 复杂 情况 下 ， 我 们 也 


会 偶尔 使 用 Neo4j 核 心 Java API 一 一 两 种 方法 都 有 它们 各 自 的 注重 点 ， 因 此 在 图 形 遍 历时 应 该 选择 合式 的 方法 。 


但 是 ， 在 遍历 一 个 图 形 数据 库 之 前 ， 需 要 选择 一 个 或 多 个 节点 作为 起 始 节点 。 本 章 使 用 了 一 个 已 知 的 节点 ID 寻找 遍历 的 起 
始 节 点 ， 但 是 在 实际 中 不 可 能 知道 一 个 特定 节点 的 ID 一 一 更 多 情况 下 是 基于 某 一 个 属性 选 定 一 个 特定 的 节点 。 使 用 这 种 “单调 
的 ”节点 查找 ， 需 要 使 用 索引 ， 这 正 是 我 们 将 要 在 下 章 中 讨论 的 。 


第 5 草 ” 数 据 率 5 


本 章 包 括 以 下 内 容 : 
创建 和 维护 手动 索引 
- 使 用 模式 索引 和 自动 索引 
创建 索引 策略 时 的 权衡 


在 前 几 章 中 我 们 已 经 看 到 了 在 Neo 和 图 形 中 通过 饥 历 天 系 在 节操 之 间 移 动 是 多 么 容易 。 在 节点 之 间 移 动 可 以 快速 、 容 易 地 找 
到 相连 的 节点 ， 例 如 ， 一 个 人 的 朋友 和 他 们 喜欢 的 电影 。 RE 束 遍 历 图 形 ， 但 是 通过 知道 从 哪里 开始 减少 


需要 刀 历 的 节操 数 是 很 重要 的 ， 随 着 数据 集 的 增加 ， 需 要 遍历 的 节点 数 也 在 增加 。 


Neo4j 使 用 索引 以 确定 在 图 形 数 据 库 中 从 哪里 开始 。 在 关系 数据 库 中 ， 一 个 索引 提供 了 通过 列 的 特定 数值 快速 和 容易 地 查找 
表 中 的 行 。 同 样 ，Neo4 笑 的 索引 使 得 它 通过 特定 的 属性 值 容易 地 查找 节点 或 关系 。 与 关系 数据 库 不 同 ，Neo4D 需 要 应 用 程序 代码 
创建 和 维护 索引 项 。 


因为 应 用 程序 的 代码 负责 这 引 ， 所 以 需要 认真 考虑 索引 策略 。 天 于 索引 的 不 明智 决策 将 导致 性 能 低下 或 硬盘 使 用 超 量 。 在 本 
草 中 ， 我 们 将 介绍 如 何 用 Neo4 创 建 、 维 护 和 使 用 索引 。 然 后 我 们 将 探索 为 什么 要 进行 厅 引 并 讨论 当 创 建 一 个 这 引 策 略 时 需要 做 
的 和 不 可 避免 的 权衡 。 


在 开始 叙述 有 关 权 衡 问 题 之 前 ， 让 我 们 看 一 下 如 何 创建 索引 项 。 


5.1 创建 系 5| 项 
当做 过 3 引 的 时 候 ， 最 常用 的 是 显 式 创建 奈 引 ， 然 后 就 像 创 建 节 点 一 样 添加 过 引 项 。 每 一 个 泰 引 项 通 弟 标识 一 个 节操 或 关系 属 
性 值 。 达 引 项 包含 对 正在 泰 引 的 属性 具有 特定 值 的 一 个 或 多 个 节点 的 引用 |。 


图 5-1 给 出 了 像 这 样 的 忆 点 索引 ， 可 以 认为 是 一 个 或 多 个 指向 书 点 的 指针 相关 的 数值 项 。 在 这 种 情况 下 ， 我 们 期 望 电 子 邮件 
地 址 是 唯一 的 ， 因 此 我 们 期 望 对 每 一 个 用 尸 有 一 个 主 电子 邮件 地 址 。 


Indexw: Users 


Eu | | il | 
EE | 上 i 


emalil: | ksmithidexample.org 
emall: | jjeffriestexample. org| nodeRefd5e Fo 

| | | Johnn Johnson 
emalil: | smithtdexample.ordo nodeRefli 送 一 … 


[USE 


图 5-1 使 用 电子 邮件 属性 作为 一 个 键 值 指 向 用 户 节点 的 索引 


在 Neo4 中 ，lIndexManager ( 系 引 管理 器 ) 使 用 一 个 简单 的 字符 串 作 为 系 引 键 提供 访问 系 引 。 在 社交 网 络 的 应 用 中 ， 通 用 
的 起 始 节 氮 是 一 个 用 户 。 要 唯一 标识 一 个 用 户 ， 需 要 用 户 用 自己 的 电子 邮件 地 址 登录 。 程 序 2-1 中 的 代码 显示 了 如 何 建立 一 个 新 
用 户 并 建立 索引 项 ， 这 意味 着 通过 电子 邮件 地 址 可 以 快速 地 找到 代表 用 户 的 节点 。 在 Index< Node> 接 口中 定义 所 有 可 能 的 这 3 引 
操作 ， 从 Neo4 系 引 管理 器 部 件 访问 系 引 的 实例 如 下 : 


IndexManager indexManager = graphDB.indexl()., 
Index<Node> UserlIndex = indexManager.ftorNodes ("users")., 


注意 只 是 简单 地 以 需求 的 名 字 向 Neo 笑 索引 管理 器 请 求 夺 3 引 。 从 代码 的 角度 看 ， 索 引 是 否 存 在 并 没 天 系 ， 如 果 论 引 不 存在 ， 
当 有 请 求 时 束 会 建立 起 来 。 参 见 程序 5-1。 


【程序 5-1】 ”使 用 Neo4j API 对 一 个 节点 创建 索引 项 


String JohnsmithName = "John Smith",; 创建 一 个 空 
string johnsmithEmail = "jsmith@example.org",; 下 节 品 代 圳 人 
Node PersonOne = graphDB .createNode().; 1 
以 用 户 的 邮 稍 PerSscnone . SetBProperty(nnamen，jcohnsmithame) ; | 2 为 新 节点 设置 局 性 
作为 一 个 慎 急 Personone.setProperty("email", johnsmithEmail).: 小 
用 户 尝 引 的 邮 IndexManager indexManager = graphDa .index!), IndexManadger 
箱 届 性 添加 一 Index<Node> userlIndex = indexManager.forNodes ("USers"); < 获得 一 个 引用 
不 索引 项 > USerIindex.add (persconOne, "email", Johnsmithemaill}.; | 
查找 长 有 用 户 名 字 的 索引 ， 竹 不 
存在 则 创建 一 个 


首先 ， 使 用 Neo4j 核 心 API 创 建 节点 并 添加 属性 (全 、 甸 ) 。 其 次 ,创建 索引 并 将 其 命名 为 users (全 、@) 一 一 这 个 名 字 
将 成 为 这 个 新 建 么 引 的 唯一 标识 符 。 


最 后 ， 将 节点 添加 到 索引 中 ( 售 ) 。 要 添加 一 个 节点 到 索引 中 ， 需 要 提供 如 下 三 个 参数 : 

. 需要 索引 的 节点 (personOne) 。 

索引 键 ("email") 。 

.索引 的 值 (jsmith@example.org) 。 

然后 ， 索 引 键 和 值 与 对 这 个 用 户 节点 的 引用 一 起 由 Lucene (Neo4j 默 认 的 索引 实现 ) 存储 ， 如 图 5-1 所 示 。 


如 果 想 要 配置 Lucene 索 引 ， 当 索引 建立 后 ，Neo4j 人 允许 传递 不 同 的 设置 选项 。 这 个 可 用 以 下 的 万 法 实现 : 


IndexManager.ftorNodes!( String lindexName, Map<String, String> 
customConfiguration }): 


映射 customConfiguration ( 自 定义 设置 ) 可 以 包含 任意 的 合法 Lucene 设 置 。 对 Lucene 的 设置 一 览 表 ， 可 以 参 
向 http://docs.neo4j.org/chunkedy/stable/indexing-create-advanced.html 上 的 Neo4j/Lucene 手 册 。 


当然 ， 将 一 个 节 氮 的 真实 值 进行 系 引 能 够 迅速 和 容易 地 找到 要 找 的 节点 。 这 可 是 我 们 将 在 下 一 节 中 看 到 的 ， 用 用 户 的 电子 邮 
件 地 址 泰 引 查找 用 尸 书 点 。 


5.2 ”通过 邮箱 地 址 会 找 用 刻 


网 络 中 有 用 己 很 棒 ， 但 是 现在 需要 让 用 户 有 一 个 成 熟 的 网 页 使 他 们 能 与 朋友 进行 联系 并 仓储 电影 信息 。 


在 这 个 网 页 应 用 中 ， 需 要 做 的 首要 事情 之 一 是 显示 用 尸 的 朋友 清单 。 查 找 用 户 的 朋友 将 涉及 遍历 朋友 关系 ,但 是 首先 需要 查 
找 代 表 已 登录 用 户 的 节点 。 


由 于 用 户 使 用 他 们 的 电子 邮件 地 址 作为 登录 1D， 这 里 以 电子 邮件 地 址 对 用 尸 进行 泰 引 ， 因 此 可 以 非常 容易 地 查找 一 个 已 登 
录 的 用 尸 。 然 后 ， 可 以 往外 遍历 朋友 关系 以 寻找 他 们 的 朋友 ， 如 图 5-2 所 示 。 


要 通过 电子 邮件 埋 找 一 个 用 户 ， 需 要 通过 以 率 引 的 专用 名 字 标 识 的 节点 索引 获得 一 个 引用 ， 在 本 例 中 ， 使 用 users 系 引 。 然 
后 可 以 得 到 一 个 针对 特定 的 键 和 值 的 奈 引 。 程 序 5-2 给 出 了 用 电子 邮件 查找 用 户 书 点 的 示例 。 


Indew: Users 


BE 值 让 点 


这 局 
| 


name: Kate Smith 


type: User 


Ss FRIEND OF 


ksmithdexample.org nodeRef 89 


jjeffriesfexample .org 


IS FRIEND OF 


smithdexamp nodeRefl23 


Je.org 


name*: Joanne Smith name*: John Johnson 


type: User 光 type: User 甸 


图 5-2 ”通过 电子 邮件 地 址 属性 从 索引 中 查找 用 户 节点 


【程序 5-2】 ”使 用 电子 邮件 属性 通过 索引 查找 单个 用 户 


得 到 一 个 string userEmalil = "Jsmith®@example.org",; 必得 党 引 管 理 关 
站 果 ， 如 找到 用 上 户 电 子 
"es IndexManadger indexManager = graphDB. index'().; 闻 件 索引 
果 名 于 一 Index<Node> UserIindex = indexManager.,forNodes ("Users"); 之 即 作 过 
个 ， 而 涉 IndexHits<Node>» indexHits = UserIndex,get ("email", userEmail);< 查找 对 点 用 户 邮 
是 没有 > Node loggedonUserNode = indexHits .getSsinglel); 性 地 址 的 已 知 索 
ES 可 :| 1 
聘 括 下 没 if {loggedonUserNode == null) | < 引 键 (邮件) 并 
有 如 此 唯 throw new NoSuchUserException("No user with email " 狭 得 亿 置 
一 的 元 剖 + USErEmail + " found").; 检查 找到 的 匹配 节点 
| 
一 旦 找到 登录 的 用 户 节 点 ， 通 过 核心 Java API 使 用 一 个 快速 简单 的 饥 历 就 很 容易 地 找到 他 们 的 朋友 。 
Iterable<Relationship> cutboundFriendRelationships = 狐 街 通过 索引 查找 
logqgedOnUserNode .getRelationships'l 小 回 的 登录 用 卢 即 
DynamicRelationshipType .withName ("is friend of"), 将 停 里 的 关系 类 型 
Direction.OUTSGOING); < 
通过 关 > forlRelationship frRel: outboundFriendRelationships)1 在 关系 的 吨 一 
et friends.add ifrRel .getOtherNode (loggedonUserNode)}; < 端 储存 节 
系 送 代 | ] TA 
在 本 节 中 ， 我 们 演示 了 Neo 人 4 索引 的 典型 工作 模式 一 一 通过 索引 查找 找到 一 个 节点 ， 然 后 按 常规 做 遍历 。 程 序 5-2 确 保 最 


找到 一 个 与 用 户 邮 箱 地 址 相 匹 配 的 邮箱 地 址 。 现 在 让 我 们 看 看 如 何 处 理 有 多 个 匹配 的 情 ; 


5.3 ”对 多 个 匹配 结果 的 处 理 
在 前 面 的 例子 中 ， 对 每 一 个 用 户 的 邮箱 地 址 进行 了 索引 ， 并 确保 邮箱 地 址 的 唯一 性 。 因 此 ， 索 引 查 找 的 结果 应 该 是 一 个 邮箱 
地 址 。 


但 是 不 一 定 都 是 这 种 情况 。 让 我 们 给 用 尸 添加 另 一 个 泰 引 属性 一 一 年 龄 。 很 显然 ， 多 个 用 己 节 点 可 能 会 有 相同 的 age 属 性 
值 。 这 种 索引 的 键 值 能 引用 多 个 节点 值 ， 如 图 5-3 所 示 。 


Fate Smith 
USEer 


nodeRef 89, 
nodeRefds5é 


i i onnson 
nodeRe fAa97 


图 5-3 ”对 年 龄 属性 索引 的 用 户 节点 且 每 一 个 键 值 潜在 引用 多 个 节点 


前 面 我们 假设 最 多 找到 一 个 与 给 定 用 户 相 匹配 的 邮箱 地 址 。 如 果 情 况 不 是 这 样 ， 则 需要 对 返回 的 索引 结果 进行 迭代 ， 如 程序 
5-3 所 示 ， 返 回 了 所 有 年 龄 为 34 岁 的 用 己 。 


【程序 5-3】 对 系 引 查找 操作 多 个 结果 的 友 代 


IndexManager lndexManager = graphDB .indexl); 


, ; | 像 得 到 单一 后梁 
Index<Node> UsSerlndex = lndexManager.ftorNodes ("users"), 5 
弄 往 调用 Get 
IndexHits<Node> lindexHits = usSerlndex.get ("age", 34).; 那 畦 调用 get 
一 不 或 过 相符 果 
for (Noae user : hits) | ] 在 一 个 或 多 种 全 
Svstem.out .printlnluser.getProperty ("name")).; 去 中 迭代 输出 第 本 


四 注意 


IndexHits (索引 结果 ) 是 一 次 性 迭代 的 ， 一 旦 用 过 ， 就 不 能 再 次 使 用 。 这 是 Lucene 的 规定 。 更 多 信息 可 以 参考 网 


站 http://lucene.apache.org 上 的 Lucene 手 册 。 


可 能 某 些 情况 会 需要 找到 所 有 34 岁 的 用 尸 ， 更 有 可 能 的 是 要 找到 一 个 汽 围 内 的 用 户 。Lucene 文 持 沁 围 查询 ， 还 有 许多 其 他 
类 型 的 现成 的 查询 方法 。Lucene 的 详细 介绍 超出 了 本 书 的 沁 围 ， 但 是 可 以 在 Lucene 手 册 中 找到 详细 的 介绍 (特别 是 
在 http://mng.bz/Lq6r) 。 


四 注意 


使 用 完 IndexHits 后 应 该 关闭 。 如 果 在 所 有 的 结果 中 迭代 (如 前 面 的 例子 ) ，IndexHits 将 会 自动 关闭 。 如 果 没 有 和 迭代 所 有 的 索 
引 结 果 ， 必 须 确保 通过 调用 IndexHits.close () 手工 关闭 。 这 是 Lucene 的 规定 ， 更 多 信息 可 以 参照 http://lucene.apache.org 上 的 


Lucene 手 册 。 


已 经 看 到 如 何 创建 和 查询 这 3 引 项 ， 下 一 个 需要 关注 的 问题 是 如 何 处 理 图 形 数据 库 的 变化 导致 奈 引 的 变化 。 


过 的 数据 进行 修改 的 处 理 


5.4 ”对 条 5 


系 引 项 的 创建 并 不 仅仅 是 创建 和 删除 。 即 使 在 本 章 的 简单 例子 中 ， 也 需要 处 理 用 户 改变 他 们 的 邮箱 地 址 或 者 想 要 删除 他 们 的 
账户 的 情况 。 


因为 应 用 开 友 者 对 使 用 的 索引 策略 非常 谨慎 ， 所 以 Neo 笑 并 不 目 动 更 新 由 手动 做 的 这 引 3 引 起 的 图 形 数据 库 本 身 的 数据 改变 。 
后 面 将 会 看 到 如 何 通 过 其 他 一 些 机 制 获得 这 类 灵活 性 的 例子 ， 但 是 现在 我 们 将 重点 天 注 如 何 处 理 涉及 手动 创建 之 引 而 引起 的 变 
化 。 

当 一 个 用 己 想 要 更 改 他 的 邮箱 地 址 时 ， 将 会 友 生 什 么 情况 ? 我 们 已 经 提 人 到， 所 有 可 能 的 索引 操作 都 在 Index< Node> 接 口 定 
> 


Index<Node> userIndex = indexManager.ftorNodes ("Users'").; 


当 看 到 Index< Node> 接 口 时 ， 也 许 需 要 注意 的 第 一 件 事情 是 没有 更 新 方法 ， 一 旦 已 经 查找 过 一 个 这 3 引 ， 就 没有 方法 对 这 个 
已 经 存在 的 索引 进行 修改 。 解 决 的 方法 非常 简单 : 当 处 理 Neo4j 索 引 时 ，“ 先 删除 后 添加 ”等 于 “更 新 ”。 程 序 5-4 展 示 了 如 何 
使 用 Neo4j 核 心 Java_ API 完成 这 个 操作 。 


【程序 5-4】 使 用 顺序 的 删除 和 添加 操作 更 新 索引 


String userEmall = "Jgmthoexample.org"; 
string updatedUserMail = "Jsmith@shinynew.example.org" 信用 索引 
i es DE es 获取 已 有 的 
[ndexManager lndexManager = graphDB. 1ndexl). 猎取 已 月 田 
Index<Node> UserIndex = indexManager.forNodes ("Users"); 用 户 布 点 
IndexHits<Node>»> lndexHits = WUSerlIndex.get ("email'", userEmall).; 
Node loggedoOnUserNode = indexHits .getSingle(}.; 
if (loggedonUyserNode == null) 1 删除 认定 节 占 
throw new NoSuchUserExceptionl(l"No user with emall " 邮箱 地 址 项 
FA 
给 索引 十 USErEmall + " found").; 
添加 新 | 更新 上 共有 新 
ee 邮 汀 属性 章 
的 属 usSerIndex. remove (loggedonUserNode, "email", userEmall).; < 好 条 属性 全 
下 Lt = 上 
性 恒 loggedOnUserNode. setProperty("emall", updatedUserMall):; 的 凶 点 


>» USerIndex.add llogsgedOnUserNode, "emall", updatedUserMall},; 


索引 天 系 
我 们 已 经 了 解 了 如 何 创 建 索引 项 并 在 图 形 数据 库 中 快速 查找 节点 ， 但 是 也 可 以 索引 节点 之 间 的 关系 。 这 非常 像 索 引 节 点 ， 但 
是 使 用 关系 属性 作为 主键 。 


按 以 往 的 经 验 ， 并 不 经 常 对 关系 索引 ， 对 关系 索引 也 并 不 是 一 个 好 的 解决 方案 。 这 并 不 是 说 关系 索引 是 一 个 低劣 的 操作 ， 但 
是 如 果 添 加 了 很 多 的 关系 索引 ， 那 就 很 值得 问 问 为 什么 了 ? 


通常 一 个 图 形 数 据 库 将 会 以 节点 代表 一 些 形式 的 实体 ， 例 如， 人 、 电 影 和 城市 ， 关 系 就 代表 了 这 些 实体 之 间 的 关系 。 那 么 经 
常 问 的 问题 是 这 些 实体 与 谁 相 连 。 例 如 ， 谁 喜欢 这 部 电影 ， 谁 是 一 个 特定 人 的 朋友 ， 或 者 离开 这 个 城市 的 交通 路 线 。 


然而 ， 很 可 能 想到 回答 这 些 问 题 需 要 用 关系 索引 。 如 果 选 择 在 电影 数据 库 中 以 不 同 的 关系 对 应 不 同 的 评级 来 代表 星 的 级 别 ， 
索引 这 个 关系 将 会 快速 找到 所 有 五 星 级 的 评价 


了 解 更 多 有 关 关 系 索 引 可 以 参见 Neo4j 手 册 : http://docs.neo4j.org/chunked/stable/indexing-relationships.html。 


我 们 将 在 本 章 的 后 面 详细 讨论 有 天 系 引 的 权衡 ， 但 是 ， 我 们 首先 要 通过 一 个 目 动 系 引 来 完成 我 们 对 系 引 选项 选择 的 过 程 。 


5.2 ” 目 动 奈 5| 


本 章 前 面 讲 的 是 人 工 创 建 和 维护 率 引 项 。 如 果 你 是 从 天 系数 据 库 世界 来 的 ， 你 将 会 好 奇 为 什么 数据 库 不 能 为 我 们 做 这 项 工 
作 。 毕 葛 ， 在 关系 数据 库 中 ， 你 只 需 声 明 表 示 哪 一 列 需 要 索引 ， 然 后 让 关系 数据 库 在 插入 、 更 新 和 删除 行 时 维护 那个 泰 引 即 可 。 


Neo4j 有 两 种 目 动 维护 索引 的 方法 一 一 模式 这 引 和 上 自动 奈 引 ， 首 先 让 我 们 看 一 看 模式 索引 。 


5.5.1 模式 索引 


在 2.0 版 本 中 ，Neo 有 引进 了 模式 系 引 的 概念 ， 从 概念 上 讲 ， 这 与 传统 的 关系 数据 库 使 用 的 索引 处 理 方法 很 相似 。 


模式 素 引 与 节点 标签 的 概念 紧密 相关 ， 我 们 在 第 3 章 中 已 经 做 过 介绍 。 每 一 个 模式 索引 专门 对 应 着 一 个 标签 和 一 组 属性 。 例 
如 ， 可 以 对 一 个 用 户 的 姓名 属性 name 定 义 索 引 ， 或 者 对 电影 的 名 字 和 出 品 年 份 属性 year 定 义 索 引 。 你 要 做 的 束 是 定义 索引 ， 攻 
此 ，Neo4D 会 负责 维护 它们 。 这 意味 着 当 创 建 一 个 具有 标签 和 属性 的 节点 并 匹配 一 个 或 多 个 索引 时 ， 所 有 的 索引 都 会 以 那个 值 进 
行 更 新 。 当 删除 一 个 节点 上 时， 那个 节点 的 所 有 与 相关 索引 有 关 的 索引 项 都 会 被 自动 删除 ， 当 更 新 节点 关系 时 也 是 如 此 。 


让 我 们 看 一 个 真实 的 例子 ， 参 见 程 序 5-5。 


【程序 5-5】 与 Java API 一 起 使 用 模式 索引 


Label movieLabel = DynamicLabel.label ("MOVIE").; r 创建 将 要 使 用 
Label userLabel = DynamicLabel ,label ("USER").:; | elt 


Node movie, USer: 


/:/ Create schema 

try (Transaction tx = graphDb.beginTx()) 1 

graphDb.schemal}) .indexFor (movieLabel) .onl"'name") .createl(}).:; 
graphDb .schema() .indexFor (userLabel) .onl"name") .create'l).; 


Ee i ee 
/ ,， E 义 用 户 锅 
tx. SUCCessl) i 
\ 宇 骆 性 党 引 
| 
/:/ Bdd Labels and properties TE 
和 | 3 i 0 导 ” 三 拉 开关 1 
try (Transaction tx = graphDb.beginTx()) 1 9 i 
movie = graphDb.createNode (movieLabel).; : ColJins 下 局 
moOvlie. Set Propertyl"name"", "Michael Collins").,; 
user = graphDb.createNode (userLabel).:; 2 创建 过 订 
BY HE 


USEer .SEtProperty!( "nam", "Michael Collins"):; 


tx SUCcesgs():; 


| 
/ /WeLrIEY results 站 广 才 全 要 吉 坦 浊 
try (Transaction tx = graphDb.beginTx()) 1 
Resourcelterable<Node> result = 电 . 划 
graphDb.findNodesByLabelhAndProperty ( 只 证 加 裁 的 
movieLabel, "name", "Michael Collins"),; 登 划 姥 副 日 
assertEquals(l1, TteratorUtil .count (result))}, 年 正确 节操 
assertEoquals (movie,.getId(), result.iterator() .next () .getId()});. 


tx.success():; 


Tr 


这 个 例子 使 用 了 两 个 标签 : 一 个 是 电影 ， 称 为 MOVIE， 另 一 个 是 用 户 ， 称 为 USER， 这 些 是 前 面 定义 的 (@) ， 


现在 要 定义 以 后 需要 的 模式 这 引 。 这 与 在 关系 数据 库 中 定义 泰 引 非常 相似 。 在 图 形 数据 库 服 务 模式 
(GraphDatabaseService.schema () ) 方法 中 可 以 使 用 Java API 创建 索引 。 首 先 ， 对 name 属 性 创建 MOVIE 标 签 索 引 (@ 
) ， 然 后 对 USER 标 签 进行 同样 的 操作 (全) 。 注 意 这 段 代码 包含 在 它 本 身 的 事务 中 ， 与 本 例子 的 其 他 部 分 独立 存在 ， 这 是 因为 
这 部 分 代码 仅仅 在 应 用 的 最 前 面 编写 一 次 。 更 为 重要 的 是 ， 如 果 试 图 在 一 个 事务 中 做 这 一 切 ， 则 将 得 到 出 错 的 信息 
一 “org.neo4j.graphdb.ConstraintViolationException: Cannot perform data updates in a transaction that has 


performed schema updates.” 。 


定义 索引 后 就 可 以 继续 创建 节点 。 首 先 为 电影 Michael Collins 创 建 具 有 MOVIE 标 签 的 节点 (全) ， 因 为 电影 的 标签 和 
name 属 性 与 早已 定义 的 索引 相 匹 配 ， 这 个 节点 将 自动 加 到 索引 中 并 可 以 以 名 字 搜 索 。 下 一 步 ， 是 为 了 有 趣 ， 创 建 一 个 用 户 名 字 
为 Michael Collins 的 节点 ， 与 电影 的 名 字 相 同 (全 ) ， 然 后 提交 事务 。 


假设 所 有 的 事情 都 按照 计划 做 完 ， 那 么 现在 真实 期 望 所 创建 的 节点 能 被 索引 。 可 以 通过 查找 电影 Michael Collins 来 证 实 。 
要 搜索 模式 率 引 ， 使 用 
GraphDatabaseService.findNodesByLabelAndProperty (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 (@) 。 正 像 名 字 中 所 包含 的 ， 这 个 方法 
将 按 指定 的 标签 和 属性 值 搜 索 所 有 的 节点 。 在 这 种 情况 下 ， 将 搜索 与 Michael Collins 值 相 匹配 的 name 属 性 的 所 有 MOVIE 标 
签 。 返 回 的 结果 是 一 个 包含 匹配 证 点 的 Java 可 过 代 集 。 这 个 搜索 结果 正 是 所 期 望 得 到 的 那 一 个 。 有 两 个 节点 具有 相同 的 名 字 
Michael Collins， 但 只 有 一 个 具有 MOVIE 标 签 ， 并 且 这 也 就 是 所 期 待 得 到 的 那个 。 这 个 过 程 证 明了 结果 的 正确 (@) 。 


每 一 个 节点 可 以 附加 一 个 或 多 个 标签 ， 每 一 个 标签 可 以 有 一 个 这 引 。 如 果 节 后 具 有 多 个 标签 ，Neo 笑 将 会 确保 相关 的 这 引 按 
要 求 更 新 。 程 序 5-6 是 一 个 演示 例子 。 


【程序 5-6】 更 新 多 个 模式 达 引 


Label userLabel = DynamicLabel .label ("USER").; 


Label adminLabel = DynamicLabel .label ("ADMIN").; 创建 用 户 和 管 
星 册 标签 索引 


try {Transaction tx = graphDb.beginTx()}) { 
graphDb.schema(l) .indexFor userLabel) .onl"name") .create():; 
graphDb. schemal) .indexFor (adminLabel) .on("'name'") .create{(); < 
tx, SUCCess():; 


创建 具有 两 个 标 


try (Transaction tx = graphDb.beginTx(})) { 签 【管理 员 和 和 用 
Node user = graphDb.createNode (userLabel, adminLabel); 帮 ) 的 市 点 
usSer. SetProperty!("name", "Peter Smith")., 

Cx, Success().; 


try (Transaction tx = graphDb.begqinTx()) { 蛤 证 管 居 

Resourcelterable<Node> adminsearch = 
graphDb.findNodesByLabelAndpProperty ( 
adminLabel, "name™, "FPeter Smith"). <- 

assertEquals(l1l, IteratorUtil .count (adminSearch)):; 

Resourcelterable<Node> usSerSearch = ”验证 用 户 索 引 的 
graphDb.findNodesByLabelAndProperty | 更 新 是 正确 的 
userLabel, "name", "Peter Smith"). < 

assertEquals{(l, IteratorUtil.count (userSearch)).; 

tx ,success(): 


在 本 例 中 ， 对 两 个 标签 做 了 索引 : 一 个 是 常规 的 用 户 标签 USER， 另 一 个 是 管理 员 标签 ADMIN (@) 。 然 后 创建 了 单个 节 
点 ， 使 用 两 个 标签 代表 常规 用 户 和 管理 员 (@) 。 我 们 希望 可 以 通过 搜索 常规 用 户 或 管理 员 用 户 找到 这 个 用 户 ， 下 面 两 个 步骤 
正 是 确认 这 种 情况 (人 @、@) . 


到 目前 为 止 , 我 们 已 经 看 到 了 如 何 使 用 索引 创建 节点 。 我 们 也 提 到 当 删 除 一 个 节点 时 模式 索引 会 更 新 。 下 面 的 程序 表示 了 这 
种 操作 。 


rr 2 一 
try (Transaction tx = graphDb .beginTx!()) | 出 除 下 去 (在 
User.deletel).; 1 事 才 中 | 


tx. succesgs{(); 


try (Transaction tx = graphDb.beginTx{()) 1 
adminSsSearch = graphDb.findNodesByLabelhindPrroperty! 


1 了 fs 得 局 = 
adminLabel, "name", "Peter Smith",).; 民 验证 管理 员 过 
assSertEquals(0, IteratorUtil .count (adminsSearch))}.; 引 现 在 是 空 的 


USerSearch = graphDb.ftindNodesByLabelhndPFroperty l 

ugerLabel, "name", "Peter Smlth"y). | 
assertEgquals 0, IteratorUt1il.count (userSearch)}., < 
tx.sSuccess().: 


验证 用 户 索 引 
现 在 是 是 空 的 


模式 索引 方法 通过 己 点 标签 分 组 泰 引 数据 。 这 意味 着 每 一 个 索引 均 包含 标 签 的 节操 。 如 果 需 要 对 给 定 属性 的 所 有 市 点 进行 目 
动 奈 引 (不 考虑 刁 点 的 标签 ) ， 可 以 使 用 目 动 泰 引 特性 。 


5.5.2 ” 目 动 厅 引 


要 使 用 自动 索引 ， 需 要 告诉 Neo4j}J 开 节点 或 关系 ,或 两 者 同时 自动 索引 。 但 是 ， 仅 仅 是 打开 自动 索引 并 不 会 引起 任何 变 
化 。 在 大 型 数据 集中 ， 索 引 所 有 的 东西 不 一 定 可 行 ， 如 果 每 一 个 值 都 在 Neo4j 内 并 进行 索引 ， 则 存储 容量 将 增加 两 倍 或 更 多 倍 。 
由 于 维护 索引 需要 额外 工作 ， 每 当做 一 个 变更 操作 时 ， 也 将 会 使 其 在 性 能 上 降低 。 因 此 ，Neo4j 对 索引 采取 了 更 多 可 选 性 的 方 
法 。 即 使 在 自动 索引 打开 的 情况 下 ，Neo4j 也 将 仅仅 维护 指定 索引 的 节点 和 关系 属性 。 

如 何 设置 自动 索引 取决 于 Neo4j 的 运行 模式 ， 即 以 嵌入 式 模式 还 是 以 服务 器 模式 运行 Neo4j (第 10 章 将 详细 讨论 这 两 种 模 
式 ) 。 

1. 在 单机 模式 下 配置 自动 索引 

在 单机 运行 模式 下 打开 自动 索引 ， 需 要 以 额外 的 属性 修改 配置 文件 。 配 置 文件 在 4$NEO4J_SERVER/conf/neo4j.properties 
文件 夹 中 ， 需 要 添加 以 下 两 行 : 

二 
relationship auto indexing=true 


指定 要 索引 什么 ， 需 要 另外 两 行 : 


node keys indexable=name, dateOfBirth 
relationship keys indexable=type,name 


2. 企 认 入 陈 蛋 式 下 配置 目 动 系 引 
在 髓 入 式 模 式 下 打开 目 动 厅 引 ， 当 创建 图 形 数据 库 实例 时 ， 需 要 传递 额外 的 值 。 以 下 的 值 需要 作为 一 部 分 包含 在 


java.util.Map 的 含有 配置 的 参数 中 : 


Map<String, String> config = new HashMap<String, String>'(); 
COnf1g.put( Conf1g.MODE AUTO INDEXING, "true" }.; 
conftig.But!l Config.,RELATIONSHIP AUTO INDEXING, "true"™ ) 1 
EmbeddedSraphDatabase graphDb = 

new EmbeddedGraphDatabasel"/var/necd4j/data", config ); 


目 动 使 用 设置 映射 (config map) 需要 另外 的 两 个 属性 ， 里 面包 合 需 要 索引 的 一 列 主键 名 字 : 


Coniig.pPut( Conftig.NODE KEYS INDEXABLE, "name, dateOfB1irth"” ); 
conftig.pPut( Cont1ig.RELATIONSHIPF KEYS INDEXABLE, "type,; name" |);} 


3. 使 用 目 动 创建 的 率 引 


一 旦 添加 了 适当 的 属性 配置 ， 图 形 数据 库 将 通过 目 动 泰 引 变 为 可 搜索 。 例 如 ， 假 如 给 定 了 前 面 的 配置 ， 图 形 数据 库 中 的 所 有 
天 系 都 具有 了 type 和 name 属 性 ， 并 且 图 形 数据 库 中 所 有 的 节 氮 都 有 了 name 和 dateOfBirth 属 性 ， 这 些 都 可 以 通过 目 动 系 引 进行 


搜索 。 


你 可 能 已 经 注意 到 ， 在 配置 中 没有 一 种 指定 索引 名 的 方法 ， 因 此 不 能 在 一 个 索引 中 指定 索引 的 节点 名 而 在 男 一 个 索引 中 指定 
索引 的 出 生日 期 。 这 一 点 与 手动 泰 引 不 同 ， 在 手动 达 引 中 忌 是 指定 达 引 的 名 字 。 这 是 因为 Neo 笑 有 一 个 这 引 用 于 关系 目 动 奈 引 而 
男 一 个 这 引 用 于 节点 目 动 达 引 。 


下 面 的 程序 代码 给 出 打开 了 具有 name 主 键 节点 属性 的 目 动 奈 引 ， 可 以 以 特定 的 name 属 性 值 访 问 这 个 索引 并 使 用 它 查 找 节 


点 
Fruo 
冶 节 后 索引 
ButoIndexer<Node» nodeAutoIndexer = 
ed ; i ] 于 .机 | 图 
i graphDb.index(}) .getNodeAutoIndexer'().:; 说 一 小 下 让 
板 回 了 一 个 ， 杰 趣 喜 宝 上 用 
Em IndexHits<Node»> nodesWithMatchingaName = 入 站 于 在 
是 上 Er 3 二 1 | i 证 -二 1 让 
本 先 亿 时 过 nodeAutoIlIndexer.getAutoIndex() .get ("name", "John™); < JOoOhmn 的 
中 连接 » Node userNode = rodesWithMatchinaName .getsingle'l(}).; 索引 项 


使 用 Neo4 提 供 的 系统 和 目 动 泰 引 设施 可 以 使 开 友 的 工作 量 大 为 减少 ， 但 是 也 会 减少 对 这 引 结 果 的 控制 。 达 引 所 有 属性 的 想 
法 是 不 现实 的 ， 因 为 图 形变 化 操作 对 性 能 的 影响 和 对 磁盘 空间 的 需求 是 很 大 的 。 下 节 将 会 详细 讨论 对 这 一 问题 的 权衡 处 理 。 


5.6 ”过 引 的 成 本 / 效 荔 权衡 


看 到 了 Neo4 j 提 供 的 不 同 这 引 方法 ， 现 在 我 们 将 把 注 意 力 放 在 如 何 权衡 哪 一 种 过 引 策 略 适 合 于 你 的 应 用 。 可 能 你 已 经 开始 
上 友 现 ， 当 使 用 Neo4j 的 率 引 和 建 模 数 据 库 时 ，Neo4 具 有 极 大 的 灵活 性 。 


例如 ， 你 可 能 以 一 种 完全 不 同 的 万 式 建 模 社 交 网 络 的 数据 ， 这 会 对 泰 引 策略 有 影响 。 图 5-4 给 出 了 另 一 种 摘 述 数据 的 方法 ， 
用 一 个 表示 Kate 看 过 的 电影 和 朋友 证 点 作为 中 间 忆 点 建 模 。 


这 是 一 个 搬 述 社交 网 络 数 据 更 好 的 万 法 吗 ? 很 不 幸 ， 管 案 取 决 于 你 的 应 用 。 判 断 最 好 的 数据 摘 述 方法 和 这 引 策 略 主要 取决 于 
想 存 储 的 数据 和 以 什么 的 万 式 与 这 些 数据 进行 交互 。 在 本 书 的 后 面 我 们 将 会 讨论 在 不 同 的 数据 摘 述 方法 中 进行 权衡 ， 但 是 现在 我 
们 将 重点 放 在 率 引 上 。 


name: Kate Smith 


type: User 
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图 5-4 用 中 间 节 点 区 分 用 户 和 电影 节点 的 社交 网 络 图 


当 涉 及 率 引 时 ， 主 要 的 权衡 点 是 率 引 越 多 ， 所 需 的 磁盘 空间 越 大 ， 当 插入 和 更 新 图 形 数据 库 时 对 性 能 的 影响 也 越 大 ， 需 要 写 
的 管理 创建 和 更 新 泰 引 的 代码 也 殊 越 多 。 当 涉及 查询 时 ， 如 果 索 引 策 略 能 够 减少 大 量 的 图 形 ， 则 能 增强 性 能 。 


5.6.1 索引 查询 的 性 能 优势 


图 5-5 显 示 了 简单 搜索 图 形 中 的 所 有 用 户 节点 与 使 用 索引 的 明显 不 同 。 图 中 给 出 的 是 随机 查找 一 个 用 户 节点 的 平均 时 间 。 
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图 5-5 ”使 用 索引 与 对 所 有 节点 迭代 查找 节点 的 性 能 比较 

实 线 表示 的 是 找 一 个 节点 消耗 的 平均 时 间 ， 如 果 简 单 搜索 所 有 证 点， 消耗 的 时 间 与 图 形 中 的 节点 数量 成 正比 。 这 并 不 令 人 吃 


尺 ， 节 扣 越 多 ， 在 图 形 中 磁 上 要 找 的 用 尸 节点 的 搜索 束 越 多 。 


在 明显 的 对 比 中 ， 虚 线 表示 的 是 使 用 对 邮箱 地 址 这 引 查找 用 尸 节操 消耗 的 时 间 。 当 这 个 数据 稍微 变化 时 ， 消 耗 的 时 间 变 化 很 
小 ， 每 次 搜索 的 平均 变化 是 0.1~0.3 毫 秒 。 当 测试 达到 100 万 用 户 时 ， 搜 索 所 有 节点 平均 比 使 用 索引 查找 用 户 慢 上 干 倍 。 


查找 标准 程序 的 注意 点 
注意 ， 将 Neo4j 编 号 存 到 外 部 用 作 查 找 是 一 个 不 好 的 操作 ， 因 为 在 有 些 情况 下 这 些 编号 很 可 能 发 生变 化 。 应 该 把 节点 编号 看 


作为 Neo 生 内 部 实现 的 细节 ， 并 不 应 该 为 了 快速 访问 而 存储 。 


另 一 种 得 到 图 形 数据 库 中 节点 的 方法 是 通过 getAllNodes 方 法 ， 可 以 返回 一 个 可 和 迭代 量 〈Itetable) ， 用 这 个 量 迭 代 图 形 数据 库 
中 的 所 有 节点 。 对 小 数据 集 ， 这 是 一 种 切实 可 行 的 方法 ， 但 是 每 次 加 载 图 形 数据 库 的 大 量 数 据 查 找 需 要 的 一 个 特殊 节点 会 导致 性 
能 的 降低 。 


测试 使 用 了 getAllNodes 访 问 所 有 用 户 节 点 。 在 实际 的 应 用 程序 中 ， 这 种 方法 将 会 导致 性 能 比 测试 时 还 低 ， 因 为 实际 应 用 中 会 
遇 到 大 量 的 不 是 USER 类 型 的 节点 。 


就 像 我 们 一 直 说 的 ， 围 绕 达 引 的 决策 都 是 一 种 权衡 。 下 一 节 中 将 会 看 人 到， 查找 提高 的 性 能 很 容易 被 索引 的 性 能 影响 而 抵消 。 
5.6.2 ” 当 更 新 和 插入 数据 时 索引 对 性 能 的 影响 


通过 系 引 得 找 一 个 用 户 几 乎 需要 一 个 固定 的 时 间 ， 可 能 你 会 感到 不 解 ， 面 对 额外 的 正在 做 的 率 引 维护 ， 到 搬 哪 万 面 原因 造成 
了 性 能 的 降低 。 


图 5-6 显 示 了 随 着 数据 集中 用 户 数 量 的 增加 创建 用 户 节 点 所 用 的 平均 时 间 。 所 用 平均 时 间 并 不 随 着 用 户 数 量 的 增加 而 增加 很 
多 ,然而 ,创建 一 个 节点 并 索引 邮件 地 址 几乎 用 了 仪 仅 单独 创建 这 个 节点 的 两 售 时 间 。 


在 这 种 情况 下 ， 即 使 对 上 百 万 的 用 尸 ， 额 外 的 百 分 之 一 毫秒 可 能 没有 什么 区 别 ， 因 为 当 这 个 用 户 注 册 时 束 会 创建 这 个 用 户 并 
经 常 进行 更 新 ， 但 对 所 有 的 应 用 程序 ， 并 不 一 定 忌 是 这 种 情况 。 当 在 创建 和 更 新 数据 比 读 的 频率 高 时 ， 应 该 考虑 快速 更 新 和 快速 
查找 性 能 的 权衡 。 这 也 可 能 以 不 同 的 方式 访问 图 形 数 据 库 ， 因 此 可 能 有 许多 索引 ， 例 如 ， 邮 政 编码 、 年 龄 和 性 别 ， 这 当中 每 一 个 
的 插入 和 更 新 都 会 增加 性 能 的 开销 。 
除 系 引 对 性 能 的 影响 外 ， 每 一 个 率 引 都 需要 额外 的 仓储 空间 ， 下 面 我 们 来 简单 地 看 一 下 。 
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图 5-6 ”有 索引 和 没有 索引 存储 用 户 节点 的 平均 时 间 


5.6.3 ”索引 的 存储 


索引 的 过 程 实质 上 是 涉及 创建 了 较 小 查找 表 (相对 于 数据 集 来 讲 是 比较 小 的 ) ， 这 可 以 对 图 形 数据 库 中 的 某 个 位 置 进行 快速 
访问 。 这 意味 看 除了 写 索 引 数 据 而 增加 的 性 能 开销 外 ， 还 需要 更 多 的 磁盘 空间 用 于 仔 储 所 有 的 这 些 数 据 。 


5.7 ”本 音 小 结 
在 本 章 中 ， 我 们 看 到 Neo4j 提 供 了 灵活 的 机 制 可 以 使 Neo4j 应 用 程序 快速 找到 对 图 形 数据 库 感 兴趣 的 部 分 。 但 是 ， 随 着 灵活 性 
的 增加 也 带 来 了 权衡 问题 ， 要 考虑 对 什么 应 该 索引 和 对 什么 不 应 该 索引 。 


到 这 里 结束 了 本 书 的 第 一 部 分 ， 在 这 一 部 分 中 ， 我 们 介绍 了 处 理 Neo4j 图 形 数 据 库 的 所 有 基本 概念 和 技术 。 在 第 二 部 分 ， 我 
们 将 深入 探讨 Neo4j 的 一 些 关键 概念 ， 首 先 我 们 将 学 习 Neo4j 的 人 类 图 形 查 询 语言 一 一 Cyphetl 


第 二 部 分 “Neo4j 应 用 开 妈 


` 第 6 章 ”Neo4j 的 查询 语言 Cypher 

.第 7 章 事务 

` 第 8 章 深度 遍历 

` 第 9 章 ”Spring Data Neo4j 

在 第 二 部 分 ， 我 们 将 讨论 使 用 Neo4j 建 立 应 用 程序 的 相关 问题 。 


第 6 章 人 外 绍 查询 语言 Cypher 一 人 类 易 懂 的 图 形 得 询 语言 。Cyphet 提 供 了 不 依赖 于 语言 的 查询 和 处 理 图 形 的 方法 ， 这 章 讨 论 
如 何 使 用 查询 语言 Cyphet 与 图 形 领 域 模 型 进行 交互 。 由 于 Neo4j 是 一 个 完全 ACID 兼容 的 数据 库 ， 第 7 章 重 点 是 事务 以 及 如 何 控制 
和 利用 这 一 特点 确保 你 的 应 用 查询 和 存储 数据 的 一 致 性 。 第 8 章 返 回 到 遍历 API， 更 深入 地 探讨 一 些 高 级 选项 ， 通 过 这 种 专用 的 
API， 在 图 形 数据 库 中 寻 航 。 


第 9 章 介 绍 Spting Data Neo4j (SDN) ， 即 一 个 图 形 对 象 映 射 库 ， 对 有 些 应 用 情况 ， 如 处 理 一 个 非常 丰富 领域 模型 (tich 
domain model) ， 可 加 快速 度 和 简化 开发 。 


第 6 章 ”Neo4j 的 吾 询 语言 Cypher 


本 章 包 括 以 下 内 容 : 
` 介绍 查询 语言 Cyphetr 


` 执行 Cypher 查 询 


` 写 只 读 Cypher 查 询 
` 使 用 Cypher 处 理 图 形 数 据 库 


在 前 几 章 中 ， 我 们 使 用 Neo4j 核 心 Java API 处 理 和 查询 图 形 数据 库 。 这 明显 需要 一 些 Java 技 术 来 写 和 理解 程序 代码 。 另 外 ,， 
变 得 很 难 理解 ， 这 时 候 查 询 语 言 束 派 上 了 用 场 。 


随 着 查询 复杂 程度 的 增加 ， 程 序 代码 的 长 度 和 复杂 程度 都 会 增加 ， 在 有 些 情况 下 
查询 语言 的 语言 表达 结构 很 强大 ， 并 且 简 单 吻 读 。 
Neo4j 的 查询 语言 称 作 Cypher。 在 本 章 中 ， 我 们 将 解释 Cypher 的 性 质 ， 演 示 其 图 形 操作 的 基本 语法 并 包括 一 些 日 常 开 发 中 


有 用 的 高 级 特性 及 Neo4j 数 据 库 的 维护 。 


6.1 Cypher 向 介 
Cypher 是 对 图 形 的 声明 查询 语言 ， 使 用 图 形 模式 匹配 作为 主要 的 机 制作 图 形 数据 选择 (包括 只 读 和 变更 操作 ) 。Cypher 的 
声明 模式 匹配 性 质 意味 着 可 以 通过 摘 述 想 从 它 那 里 得 到 什么 查询 图 形 数 据 。 


为 了 解释 Cypher 的 工作 原理 ， 让 我 们 看 看 实际 程序 中 的 Cypher 是 如 何 应 用 的 。 


6.1.1 Cypher 入门 


图 6-1 是 一 个 社交 网 络 的 简单 图 形 表示 。 
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图 6-1 要 查询 的 一 个 社交 网 络 图 形 数 据 库 


在 第 4 章 中 ， 我 们 讨论 了 Neo4j 遍 历 API， 演 示 了 怎样 使 用 Java 代 码 查找 一 个 用 户 看 过 的 所 有 电影 。 作 为 提醒 ， 程 序 6-1 给 


了 用 过 的 Java 代 码 。 


【程序 6-1】 ”使 用 Java API 通 历 图 形 碍 找 用 户 看 过 的 所 有 电影 


try (Transaction tx = graphDb.beginTx{)) 1 
Node userJohn = graphDb .getNodeBYyId {JOHN JOHNSON NODE ID) ; 
Iterable<Relationship> allRelationships = userJohn.getRelationships'().,; 
Set<Node» moviesForJohn = new HashSet<Node>()}.: 
forlRelationship r : allRelationships})! 
if(lr.getType() .name{() .equalsIgnoreCase ("HAS SEEN"))}!| 
Node movieNode = rr.gqetEndNode!(}.; 


moviesForjJjohn.add lmovieNodel):; 


f 
For (Node movie : moviesForJohn)i 
looqger,1infol'"'User has seen movie: "+ movie,.getPropertyl name")).; 


上 


tx ,success(); 

遍历 有 三 个 阶段 : 

1) 通过 市 点 编号 查找 一 个 起 始 节 后。 

2) 从 起 始 节 点 跟随 HAS_SEEN 关 系 扬 历 图 形 。 

3) 返回 HAS_SEEN 关 系 最 终 的 节操 。 

现在 让 我 们 看 看 如 何 使 用 Cypher 编 写 同 样 的 查询 代码 ， 同 样 遵循 帝 历 的 三 个 阶段 。 


了 Rls J4 FE a 一 上 bs hs Fh i EE : . EE 
wv. 查 谍 起 始 节 点 指定 由 起 始 节点 、HRAS_SEEN 关系 和 
start user=nodetl) < 目 奈 由 影 基 上 所 姐 由 上 且 2 
[| TT | ii be | | 上 和 i | os | 


match (user)}-[:HAS SEEN] -> ‘movie) 


return movie; Se | 收回 中 影 节 点 
与 Java 代 码 一 样 ， 首 先 需 要 使 用 节点 编号 查找 起 始 节 点 ， 这 个 可 以 使 用 Cypher 的 start 和 node 关 键 词 获 得 (人 @) 。 注 意 起 始 
节 氮 的 名 字 (user) ， 在 以 后 同样 的 Cypher 查 询 中 可 以 引用 。 


下 一 步 ， 设 置 需要 输出 结果 的 匹配 模式 。 模 式 残 是 对 需要 检查 数据 库 中 的 子 图 形 的 描述 ， 它 是 由 天 系 相互 连接 的 一 些 节 氮 构 
成 。 一 个 关系 连接 的 两 个 节点 是 典型 的 图 形 模式 ， 它 是 用 () -[- () 摘 述 的 。 蔬 点 用 圆 括 号 () 指定 ， 天 系 使 用 万 括号 [] 指 
定 。 节 点 和 关系 使 用 连 字符 连接 。 在 start 句 子 中 的 节点 (前 面 例子 中 的 user) 用 作 确 定 模 式 的 左边 界 。 整 个 模式 有 两 个 已 知 元 
素 (左边 界 节点 和 关系 ) ， 将 用 作 查 找 所 有 与 右边 界 (在 我 们 的 例子 中 是 movie 节 点 ) 匹配 的 所 有 节操 。 


最 后 ， 要 查找 所 有 匹配 的 电影 ， 因 此 ， 使 用 return 关 键 字 返回 匹配 的 电影 (再 一 次 使 用 前 面 介 绍 的 用 名 字 引 用 方 上 各 ) 。 使 用 
冒号 标志 Cypher 查 询 的 结束 。 


当 运 行 这 个 Cypher 查 询 时 ， 将 会 看 到 与 使 用 相应 的 Java AP|I 方 法 完全 一 样 的 输出 结果 。Cypher 非 常 简单 易 读 ， 开 发 者 、 业 
务 人 员 和 任何 具有 足够 域 知 识 的 人 都 很 容易 理解 。 


四 注意 


从 Neo4 生 2.0 版 本 起 ，statt 语 名 是 可 选 的 。 如 果 省 略 start 语 名 ，Neo4j 将 会 试图 在 match 查 询 语句 中 从 节点 标签 和 属性 推断 start 语 


句 。 为 了 清晰 和 与 早期 版 本 的 Neo 和 j 兼 容 ， 本 章 的 所 有 查询 都 有 显 式 定义 的 statt 语 句 。 关 于 更 多 的 推断 start 语 句 ， 请 访 
问 http://docs.neo4j.org/chunked/stable/gquery-statt.html。 


那么 ， 究 竟 应 该 如 何 执行 Cypher 查 询 呢 ? 别 着 急 ， 我 们 将 在 下 一 万 作出 解释 。 
6.1.2 执行 Cypher 查 询 


有 很 多 种 方式 可 以 执行 Cypher 查 询 ， 与 Neo4j 一 起 上 友 布 的 几 个 工具 都 文 持 Cypher 执 行 ， 并 且 Cypher 也 可 以 从 java 代码 执 
行 ， 与 SQL 非常 相似 。 表 6-1 给 出 了 Cypher 执 行 选项 。 


表 6-1 ”执行 Cypher 查 询 的 工具 和 技术 


工 及 描 述 
Neo4i Shell 命令 市 信行 工具 
Neo4j 网 页 管理 控制 台 基于 网 页 的 接口 
Java 程序 执行 
REST 在 HTTP 上 使 用 REST 接口 


下 面 详细 介绍 前 三 个 选项 ， 第 四 个 选项 使 用 REST 执 行 Cypher 查 询 将 在 第 10 章 中 讨论 。 
1. 使 用 Neo4j Shell 命 令 执行 Cypher 查 询 
Neo4j Shell 命 令 是 一 个 命令 行 工具 ， 它 是 随 Neo4j 一 起 发 布 的 ， 可 以 使 用 它 与 以 下 任何 一 个 连接 。 
" 本 地 Neo4j 数 据 库 一 一 通过 指定 shell 到 Neo4j 数 据 库存 储 的 目录 和 连接。 
通过 RMI 连 接 远 程 Neo4j 服 务 器 一 一 通过 给 shell 提 供 主 机 名 字 和 连接 端口 连接 。 
Neo4j Shell 命 令 开始 脚本 语言 在 hbNEO4 _ HOME/bin/ 目 录 ，$NEO4J HOME 是 Neo4j 二 进 制 代 码 安装 的 目录 。 
表 6-2 给 出 了 基于 Linux 和 Windows 系 统 如 何 连接 本 地 和 远程 Neo4j 的 实例 。 


表 6-2 Linux 和 Windows 环 境 下 的 Neo4j Shell 命 令 开 始 脚本 语言 句法 


站 所 库 关 型 Wndows 全 人 
Ee SNEOQ4J HOME/bin/neo4]j-shell SNED4J HOME/bin/neoc4]- 
本 地 Neo4] 数据 库 -path=/var/neod4]/db shell.bat -path=/var/neo4]j/db 
SNEO4J HOME/bin/neoc4]- 
shell.bat -host=localhost 
-Port=1331 


SNEO4J HOME/bin/neo4j-shell 
-host=l]localhost -port=1337 


远程 Neo4i 数据 库 


在 开始 运行 查询 前 ， 需 要 填充 图 形 数据 库 。 对 于 这 个 例子 ， 我 们 将 使 用 第 3 章 与 第 4 章 例子 (电影 爱好 者 社交 网 络 ) 中 的 数 
据 集 。 使 用 的 数据 库 在 硬盘 上 的 位 置 是 /var/neo4j/db， 因 为 我 们 使 用 的 是 Linux 操 作 系 统 ， 但 是 可 以 基于 所 使 用 的 操作 系统 更 
换 目 录 (例如 ，Windows 操 作 系 统 c: \neo4Ndb) 


使 用 Neo4j Shell 在 $NEO4J HOME/bin 目 录 中 运行 以 下 的 程序 连接 Neo4j 数 据 库 。 
* neo4j-shell-path=/vat/neo4j/db (Linux) 。 


* neo4j-shell.bat-path=/var/neo4j/db (Windows) 。 


按 回 车 键 后 ， 将 进入 Neo4 shell 命 令 状 态 ， 如 图 6-2 所 示 ， 准 备 接受 命 


全 让 得 1. java 
Aleksas-MacBook-=-Air:bin aleksovukotics pwd 


di de 
Alexsas-MacBoox=ALr:DIN aLensavUKotlics /Neod4]=snell =path /var/neo4]/ db 
NOTE: Local Neo4] graph dataobase service at /var/neod4]/db' 


二 


Welcome to the Neod4] Shnell! Enter ‘help' for a list of conmands 


neo4j-sh (0 B 


图 6-2 ”Neo4j Shell 准 备 好 接受 命令 


当 开 始 shell 时 ， 要 确保 对 Neo4j 数 据 目 录 有 读 的 权限 。 


Neo4j Shell 本 身 支 持 Cypher， 因 此 不 需要 任何 特殊 的 命令 ， 仪 仪 在 控制 台 上 输入 Cypher 查 询 并 按 回 车 键 即 可 。 结 果 以 表 
格 形式 输出 ， 非 昔 类 似 于 在 天 系数 据 库 中 运行 SQL 查询 的 输出 。 图 6-3 给 出 了 Cypher 查 询 一 个 指定 用 户 看 过 的 所 有 电影 的 输出 绪 
果 。 

reod4]-sh CO)$ start User=node(1) 


> match Cuser})=[:HAS_SEEN]=>(Cmovie) 
> return movie: 


| MOceL4. fnane: ‘Fargo", t ype: ee 


neo4ij-=sh CO)s$ | 


图 6-3 ”在 Neo4j Shell 下 执行 Cyphet 查 询 返 回 了 表格 输出 


正如 所 看 到 的 ， 结 果 正 是 基于 图 6-1 的 图 形 数据 库 所 期 望 的 结果 。 用 户 1 (John Johnson) 确实 只 看 过 一 部 电影 : Fargo。 
在 伍 询 中 返回 的 是 movie 证 上 ， 因 此 结果 束 是 这 样 。Fargo 是 数据 库 中 的 一 个 节操 ， 内 部 编号 是 4， 两 个 属性 : name 和 type， 这 


些 值 也 正 是 所 期 望 的 值 ， 这 也 证 实 了 查询 结果 的 正确 性 。 
这 就 是 我 们 期 等 的 第 一 个 Cypher 查 询 ， 通 过 简单 搬 述 感 兴趣 的 子 图 形 得 到 了 期 望 的 结果 ， 而 没有 写 任何 的 Java 代 码 ， 也 不 
用 担心 事务 的 操作 。 


Neo4j 服 务 器 目 市 一 个 操作 工具 : 网 页 管理 控制 侣 ， 即 一 个 基于 浏 贤 器 的 对 Neo 汶 实例 多 样 的 网 页 接口 。 它 有 许多 特性 ， 可 
以 查询 、 处 理 、 可 视 化 Neo4j 图 形 数据 库 和 管理 Lucene 系 引 、 维 护 和 监控 Neo4j 设 置 。 更 详细 的 网 页 管理 控制 台 将 在 第 11 章 介 


刀 
绍 。 


要 访问 网 页 管理 控制 合 ， 需 要 运行 Neo4j 服 务 器 设置 指定 数据 库 的 位 置 ， 例 如 ， 前 一 个 例子 中 是 /vavneo4j/db。 按 照 以 下 


的 步骤 : 
1) 下 载 正确 版 本 的 Neo4j， 按 照 本 书 附录 A 中 的 详细 说 明 安 装 Neo4j 服 务 器 。 
2) 编辑 位 于 NEO4J HOME/conf/neo4j-server.properties 的 Neo4j 主 服务 器 配置 文件 ， 定 位 下 列 的 行 : 
个 工 可 .neo4j .server.database.location=data/graph.db 
替换 数据 目录 并 使 其 指向 上 一 节 中 创建 的 图 形 数据 库 : 
Org .neod] .server.database. location=/var/neo4d4] /db 
3) 保存 配置 文件 。 
4) 使 用 以 下 命令 打开 Neo4j 服 务 器 : 


9NEO4J HOME/bin/neod4] start 


随 着 服务 器 的 加 载 和 运行 (可 能 需要 几 秒 钟 的 时 | 间 ) ， 通 过 浏览 器 打开 http://localhost: 7474， 束 可 以 访问 网 页 管理 控制 
人 台 。 网 页 管理 控制 从 的 主页 如 图 6-4 所 示 。 
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图 6-4 浏览 器 中 的 网 页 管理 控制 台 主 页 


网 页 管理 控制 台 在 浏览 器 (使 用 一 些 杰 出 的 JavaScript 脚 本 语言 ) 内 置 了 一 个 完全 功能 的 Cypher 查 询 执行 引 敬 。 可 以 在 页 
面 项 部 的 文本 字段 里 输入 Cypher 查 询 ， 然 后 按 回 车 键 ， 将 会 在 浏览 器 窗口 中 看 到 查询 结果 。 图 6-5 给 出 了 一 个 在 网 页 管理 控制 台 
执行 Cypher 查 询 的 例子 。 


不 用 命令 行 访问 运行 中 的 Neo4 服 务 器 实例 ， 在 网 页 管理 控制 台 内 运行 Cypher 查 询 是 非常 方便 的 。 


全 注意 


Neo4j 网 页 管理 控制 台 还 有 另外 一 个 非常 优秀 的 特点 


果 ， 可 以 使 用 浏览 器 右 下 角 的 两 个 按钮 。 


可 以 在 浏览 器 中 可 视 化 Cyphet 查 询 的 结果 。 要 切换 表格 和 可 视 化 结 


到 目前 为 止 ， 这 里 摘 述 的 是 手工 运行 Cypher 查 询 ， 使 用 的 工具 是 随 Neo4j 一 起 太 布 的 。 我 们 说 过 不 写 Java 代 码 也 可 以 非常 
容易 地 得 询 图 形 数据 库 。 但 是 右 把 Cypher 查 询 集成 到 Java 的 应 用 程序 中 将 会 垮 样 ”Neo4j 核 心 Java APl 包 合 一 个 Cypher APl， 
使 得 从 Java 代 码 中 运行 Cypher 查 询 非 党 简单 。 


| 亩 Neod) /tmp/ineodl=chapters i I 
全 | 图 Google 


start john=node(1) match john-[:IS FRIEND OF]—> 
(User)=[:HAS SEEN]=>(movie) return movie:; 


start john=node(8) match john=[:IS_FRIEND OF]-=>(user}=[:HAS_SEEN]->{(movie} return 


和 


movie 


name 
type 


w Raturned 3 rows in 398 ms P | = 


start john=nodel1) match john-[:IS FRIEND OF]->(user}-[:HAS SEEN]->{(movie}) return 


图 6-5 在 网 页 管理 控制 台中 执行 一 个 Cyphet 查 询 


3. 用 Java 代 码 执行 Cypher 查 询 


在 Java 中 使 用 JDBC 驱 动 程序 和 JDBC API 很 容易 查询 关系 数据 库 。 获 得 连接 ， 创 建 和 执行 声明 ， 通 过 结果 集 迭 代 ， 立 刻 惑 会 
得 到 JDBC 数 据 库 查询 ， 在 Java 中 执行 Cypher 查 询 显 然 更 为 简单 。 


以 下 代码 演示 了 在 如 图 6-5 的 网 页 管理 控制 全 中 执行 的 同一 个 样本 Cypher 查 询 ， 用 以 查找 一 个 特定 用 户 看 过 的 所 有 电影 。 


谓 过 所作 Neo4 

5 和 了 数据 库 实 例 北 
有 ExecutionEngine engine = new ExecutionEngine (graphDb); < 质 行 引 敬 
Cypher ~ String cql = "gtart User=node (1)" + Ve 
查询 字 " mateh (user)-[:HAS SEEN] ->»> (movie})™ + 通过 传 违 给 笑 
秆 串 " return movie;",; 例 化 了 的 执行 

ExecutionResult result = engine.execute (coql):; < 引 敬 执行 查询 

Svetem., out .println (Execution result:" + result.tostringl)}; 可 

打印 了 本 


可 以 看 到 ， 对 Cypher 查 询 ， 需 要 做 的 是 实例 化 Neo4j 的 执行 引擎 (ExecutionEngine) (人 @) 并 且 给 它 传递 有 效 的 Cypher 
查询 (@、@) 。ExecutionResult.toString () 方法 与 Neo4j Shell 的 输出 格式 相同 ， 这 对 调试 程序 和 排除 问题 非常 有 用 。 


在 Java 中 通过 Cypher 查 询 结 果 和 迭代， 所 需要 做 的 就 是 对 execute (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 返回 的 EXecutionResult 对 象 进 行 壬 代 : 


ExecutionResult result = engline.execute (cgql)},; 
for (Map<String,Object> row : result)! 
SyYstem.out .println("Row:" + roOw); 


每 一 个 迭代 元 素 都 包含 着 一 个 结果 行 ， 代 表 一 个 Java 映 射 ， 这 里 的 主键 是 列 的 名 字 ， 值 就 是 实际 的 结果 值 。 


前 面 的 小 段 程序 逐 行 迭 代 了 Cypher 查 询 结 果 。 另 一 个 选项 是 通过 单个 的 列 迭 代 结 果 ， 当 不 是 对 返回 的 所 有 列 都 感 兴趣 时 非 
单 有 用 ， 融 像 下 列 的 程序 演示 的 那样 : 


i LN] 
pp 对 指定 的 
从 寻 果 > List<Strings columms = 工 eSUlt .eolumnsr) ， NS 

' - | 可 | 5 | 

表 中 得 for (String columm : columns)l I 
汪汪 姓 四 
到 所 有 Iterator<Object> columnValues = result .columaAas'licolumn):; 池水 
a | whilelcolumnValues.,hasNext (}}1 站 清 讨 站 果 
EE | 下 1 FL te 
时 国生 svstem.out ,println("' Value:" + colummVvalues,.next ()); No 
ee -二 | LL Le | 


Cypher 和 Scala 尽管 核心 Neo4j 图 形 引 警 是 用 Java 实 现 的 ， 但 是 Neo4j Cypher 引 | 掌 是 用 Scala 实 现 的 。Scala 是 一 种 流行 
的 、 混 合 的 功能 编程 语言 ， 运 行 于 Java 虚 拟 机 上 。 关 于 更 多 的 Scala 知 识 ， 请 参阅 www.scala-lang.org/。 
Cypher 的 替代 者 
Cyphet 并 不 是 唯一 的 图 形 查 询 语言 ， 另 一 个 种 用 的 图 形 查 询 语言 是 Gtfemlin，Neo4j 也 支持 Gtemlin。Gtemlin 实 际 上 是 一 组 定义 
如 何 遍 历 和 处 理 图 形 的 接口 ， 这 些 接 口 是 通过 每 一 个 与 之 兼容 的 图 形 引 擎 实现 的 。 这 意味 着 理论 上 与 Gtemlin 相 同 的 查询 可 以 在 
任何 与 之 兼容 的 图 形 数据 库 上 使 用 ， 使 得 代码 可 移植 。Grtemlin 是 一 个 开源 库 ， 并 且 是 流行 的 图 形 库 Tinkerpop 栈 的 一 部 分 


(https://github.com/tinkerpop/gremlin) 。 


Gremlin 是 命令 式 语言 ， 用 户 需 要 描述 如 何人 遍历 图 形 ，Cyphet 是 声明 性 语言 ， 


Cyphetr 和 Gremlin 的 主要 区 别 是 它们 的 性 质 
它 使 用 模式 匹配 描述 需要 哪 一 部 分 图 形 数 据 。 这 就 使 得 Cypher 易 读 且 易于 理解 。Gremlin 可 以 在 不 同 的 图 形 数 据 库 中 移植 ， 而 


Cyphet 是 由 Neo4j 团 队 开 发 ， 并 仅 应 用 于 Neo4j 图 形 数 据 库 。 
Gremlin 的 句法 与 使 用 超出 了 本 书 的 讨论 范围 ,但 是 可 以 在 以 下 网 站 查阅 更 多 的 资料 : https://github.com/tinkerpop/gremlin。 


现在 知道 了 使 用 基于 网 页 的 、 基 于 命令 行 应 用 的 和 基于 使 用 Java API 的 执行 Cypher 查 询 ， 下 面 开始 使 用 Cypher 查 询 。 


6.2 Cypher 的 基本 句法 


Cypher 人 句法 由 四 个 不 同 的 部 分 组 成 ， 每 一 部 分 都 有 一 个 特殊 的 规则 : 


start 一 一 查找 图 形 中 的 起 始 节 点 。 


.match 匹配 图 形 模 式 ， 可 以 定位 感 兴趣 数据 的 子 图 形 。 
WwWhete 基于 某 些 标准 过 滤 数 据 。 
.tetutn 返回 感 兴 趣 的 结果 。 


Cypher 的 模式 匹配 性 质 使 得 图 形 模式 成 为 任何 查询 的 重点 问题 。 这 就 是 为 什么 我 们 要 首先 讨论 Cypher 的 图 形 模式 匹配 技 
术 。 


6.2.1 模式 匹配 
模式 匹配 是 Cypher 的 重要 方面 ， 它 提供 了 强大 的 功能 以 人 可 读 的 句法 拉 述 子 图 形 结构 。 以 下 的 程序 演示 了 以 单个 命名 的 关 
系 连 接 的 两 个 证 点 的 模式 匹配 : 


start user=nodel!l) 
match (user}-[:HAS SEEN] -> (movie) 
return movie: 


当 摘 述 天 系 时 ， 在 方 括号 里 面 的 冒号 (: ) 后 面 指定 天 系 的 类 型 。 当 建立 天 系 (句法 上 大 小 写 敏感 ) 时 ， 类 型 必须 与 它 定义 
的 类 型 严 属 一致。 这 个 简单 的 查询 使 用 [: HAS_SEEN] 句 法 摘 述 了 单个 HAS_SEEN 天 系 。 


关系 方向 的 描述 是 在 Cypher 中 用 ASCII 实 现 的 。 关 系 的 连接 是 用 ASCII 箭 头 (单个 连 字符 接着 一 个 大 于 号 或 前 面 有 一 个 小 于 
号 [] -> 或 <-[0) 连接 着 它 的 凯 点 。 天 系 的 起 点 使 用 单个 连 字 符 连 接 ([]-) 。 在 前 面 的 例子 中 ， 匹 配 用 户 看 过 的 电影 
(match (user) -[: HAS SEEN]-> (movie) ) 模式 指定 了 从 user 节 点 指向 movie 节 点 的 HAS SEEN 关 系 。 


如 果 不 在 意 天 系 的 方向 ， 或 者 不 清楚 哪 一 个 是 关系 的 起 始 忆 点 或 终止 节点 ， 则 可 以 在 天 系 的 两 端 都 使 用 单个 连 字 符 连 接 ， 在 
这 种 情况 下 解读 为 “任意 ”。 如 果 想 知道 两 个 用 己 是 否 是 朋友 ， 忽 略 挥 方 同 ， 可 以 使 用 下 面 的 模式 。 


start userl=node(1) 

match (userl)-[:1IS FRIEND OF] - (user2) 
return USerz:; 

现在 让 我 们 看 看 在 Cypher 中 如 何 使 用 节点 和 关系 标识 。 

1. 使 用 节操 和 关系 标识 


在 Cypher 查 询 中 ， 节 点 和 关系 都 可 以 与 标识 关联 ， 这 种 关联 使 得 以 后 可 以 在 同样 的 查询 中 引用 同一 个 图 形 实体 。 下 面 的 例 
子 在 返回 语句 中 引用 了 movie 节 点 。 


天 系 也 可 以 命名 ， 使 用 稍微 不 同 的 语法 : 
start usSer=node(l) 


match (user)- [r:HAS SEEN] -> (mowvie) -一 这 
return movie; 


要 命名 一 个 关系 ,在 天 系 类 型 之 前 ,人 简单 地 为 要 命名 的 关系 在 方 括号 里 面 指定 名 字 即 可 。 


当 创 建 复杂 的 模式 时 ， 命 名 节点 和 关系 是 非常 有 用 的 ， 因 为 在 以 后 的 Cypher 查 询 的 其 他 地 方 可 以 引用 它们 。 但 是 ， 如 果 以 
后 不 需要 引用 图 形 实 体 ， 避 免 使 用 标识 将 会 使 查询 可 读 和 易于 理解 。 


在 前 面 的 例子 中 ， 节 点 是 被 命名 的 (user 是 起 始 节 点 而 movie 是 查询 需要 返回 的 节点 ) ， 但 是 关系 没 被 命名 ， 因 为 没有 任何 
地 万 引用 它 。 要 使 关系 匿名 ， 只 需 在 方 括号 内 保留 冒号 后 面 的 关系 类 型 ， 丈 像 在 原始 的 查询 中 做 得 一 样 : 


七 记 下 七 Er=NnOde (ll) 


er 1 ET 2 
match (user)-[:HAS SEEN] -» (moOVvL1ie) 一 六 有 有 饭 于 【草书 ) 的 去 蒜 
return moOVvie: 
类 似 地 ， 节 点 也 可 以 匿名 。 要 使 节点 匿名 ， 使 用 空 的 圆 括号 () 指定 节点 。 为 了 演示 这 种 方法 ， 我 们 编写 另 一 个 Cypher 查 
询 ， 这 里 想 要 从 user 节 点 返回 所 有 的 HAS SEEN 关 系 ， 而 不 必 担 心 movie 节 点 : 
bt Woop oe | 没有 名 字 的 关系 使 用 的 没有 名 
match fuser)- [r:HAS SEEN]-=»>{) c ee 
> 了 字 《 呀 省 】》 鸭 于 点 


TECWUrET YT: 
使 用 空 的 圆 括 号 描述 一 个 期 望 的 节点 ， 但 是 不 在 意 其 任何 属性 ， 以 后 也 不 想 引 用 它 ， 因 此 不 给 它 命名 。 
名 注意 


在 Cypher 查 询 的 match 语 名 中 可 以 不 使 用 圆 括 号 指定 命名 节点 ， 例 如 start user=node (1) match user-[: HAS_SEEN]->movie 
return movie。 在 复杂 的 查询 中 ， 如 果 可 能 ， 也 可 以 去 掉 圆 括号 ， 以 简化 查询 且 使 之 可 读 。 匿 名 节点 必须 有 圆 括 号 。 


到 目前 看 到 的 所 有 模式 都 非常 简单 ， 即 由 单一 的 关系 连接 的 两 个 节点 。 下 面 让 我 们 看 看 如 何 使 用 Cypher 匹 配 更 复杂 的 模 
起 。 
2. 复 杂 模 式 匹 配 


Cypher 查 询 支 持 相 当 复杂 的 模式 匹配 。 让 我 们 看 看 另 一 个 例子 : 碍 找 用 户 1 的 朋友 看 过 的 所 有 电影 。 人 在 第 4 章 中 已 经 使 用 
Neo4j 胃 历 API 解 决 了 这 个 问题 ， 因 此 ， 现 在 看 看 如 何 使 用 Cypher 查 询 解决 这 个 问题 : 


start John=node (1) 页 小 关 雪 入 接 三 小 切 占 苦 
江 ; TF 了 Ee Ee 笠 到 二 人 = 条 局 3 
match John-|[:IS FRIEND OF| ->()- |[:HAS SEEN] ->{(movie) 3 业 3 本” 


return movie: 


从 已 知 的 名 字 为 john (节点 编号 是 1) 开始 ， 匹 配 |S_FRIEND_OF 关 系 指向 的 另 一 个 节点 (匿名 ) ， 依 次 具有 HAS_SEEN 关 


系 指向 另 一 个 movie 节 氮 。 
没有 必要 命名 所 有 的 关系 以 及 紧 接着 的 节点 。 所 有 需要 返回 的 是 代表 John 的 朋友 已 经 看 过 的 电影 节点 。 
运行 这 个 查询 将 会 返回 John 的 朋友 已 经 看 过 的 所 有 电影 节点 ， 不 管 John 是 否 看 过 : 
| Node [5] {name->"Alien",type->"Movie"} 


| Node [4] {name->"Fargo",type-s"Movie") 
| Node [6] {name->"Heat",type->"Movie"l| 


如 果 想 要 这 个 社交 网 络 基于 John 的 朋友 的 喜好 为 John 推 荐 电影 ， 那 么 应 该 跳 过 他 目 己 已 经 看 过 的 电影 。 要 得 到 想 要 的 结 
果 ， 在 前 一 个 例子 的 结果 中 使 用 匹配 John 已 经 看 过 的 电影 模式 进行 过 滤 。 使 用 Cypher 查 询 ， 在 同一 个 查询 中 ， 如 果 需 要 ， 可 以 
在 两 个 模式 中 引用 相同 的 节点 ， 匹 配 多 个 模式 。 


看 看 以 下 程序 的 查询 |: 


start John=node!l) 


mat ch -0 匹配 John 的 朋友 已 经 看 过 
john- [:IS FRIEND OF] ->()-[:HAS SEEN] -> (movie), a 的 任何 一 部 电影 

john- [rr:HAS SEEN] -> (movie) < 匹配 John 已 经 在 讨 

LELULI MOVLE; pe 的 让 彤 


Cypher 查 询 中 的 多 个 模式 使 用 逗号 (，) 作为 分 隔 符 分 开 。 这 里 的 第 一 个 模式 是 前 一 个 例子 中 使 用 的 模式 一 匹配 John 的 
朋友 已 经 看 过 的 电影 (@) 。 第 二 个 模式 匹配 John 已 经 看 过 的 所 有 电影 (@) 。 


全 注意 
作为 结果 的 节点 必须 匹配 所 有 去 号 隔 开 的 模式 ， 相 当 于 一 个 “并 ” (AND) 语句。 


这 里 感 兴趣 的 位 是 使 用 同一 个 古 点 作为 两 个 模式 中 的 销 点 (两 个 模式 都 从 同一 个 ohn 节 点 开始 ， 都 匹配 同一 个 movie 证 
所 ) 。 


如 果 运 行 这 个 查询 ， 将 会 得 到 单一 的 结果 : Fargo。 


| Node [4] {name->"Fargo",type->"Movie") 


很 明显 这 并 不 是 所 要 的 结果 。 匹 配 了 所 有 的 John 的 朋友 已 经 看 过 的 电影 (结果 是 三 部 电影 ) ， 然 后 匹配 那些 John 已 经 看 过 
的 ， 结 果 是 John 和 John 的 一 些 朋 友 看 过 的 。 


尽管 这 个 可 以 成 为 一 个 有 用 的 查询 (如 果 要 回答 John 和 John 的 朋友 共同 看 过 的 电影 这 个 问题 ) ， 但 在 这 里 不 是 我 们 想 要 的 


信和 
采 


了 


O 


需要 用 匹配 不 存在 的 天 系 : John 没 有 看 过 的 电影 ， 奉 换 第 二 个 模式 。 下 面 的 程序 演示 了 如 何 使 用 NOT 语 句 句 法 查找 John 的 
朋友 看 过 ， 但 是 John 没 有 看 过 的 电影 。 


匹配 所 有 John 的 
朋友 看 过 的 电影 


start John=node:users (name = "John Johnson") 
match john-[:ISs FRIEND OF| -> (USEer}) - [:HAS SEEN] -> (movie) 
where NOT john-[:HAS SEEN] -> (movie) = 计 滤 掉 John 


return movie .name; ”看 过 的 电器 
“ ja 9 所 车 


第 一 个 模式 与 以 前 的 完全 一 样 一 一 匹配 John 的 朋友 看 过 的 电影 (@) 。 第 二 个 模式 ，where 语 句 的 一 部 分 ， 过 滤 第 一 个 模 
式 返 回 的 电影 ， 通 过 HAS SEEN 关 系 有 选择 的 连接 (@) 。 


四 注意 


在 本 例 的 where 语 句 (@) 中 ， 在 结果 中 过 滤 掉 不 感 兴 趣 的 内 容 ， 与 关系 数据 库 中 的 SQL 语句 非 常 相似 。 本 章 后 面 将 详细 讨 
论 whete 语 名 。 


最 后 的 结果 包括 两 部 电影 (Heat 和 Alien) ， 这 也 是 期 翌 的 结果 ， 图 6-1 给 出 了 数据 集 。 图 6-6 显 示 了 在 Neo4j shell 中 运行 
查询 的 结果 。 


mec4]=Sm 【13 stort JohNn=node:userstnome = Jonn Jonnson ) 
> match JjJohn=-[:IS_FRIEND_OF]->(Cuser})-[:HAS_SEEN]=>Cmvie) 
> Where NOT john=[:HAS_SEEN]=> (movie) 

> return mvie,.nome: 

中 


| MOvie ,name | 


neo4j-sh C7)$ 目 


图 6-6 ”查找 基于 他 们 的 朋友 看 过 的 电影 为 用 户 推荐 的 电影 在 Neo4j Shell 执 行 查询 的 结果 


现在 已 经 使 用 Cypher 通 过 基于 用 户 对 电影 的 评级 找到 了 推荐 的 电影 ， 但 是 不 包括 用 己 已 经 看 过 的 电影 。 在 第 4 章 中 使 用 Java 
API 对 同一 个 问题 的 解决 方案 需要 编写 40 多 行程 序 。 这 次 用 5 行 的 Cypher 查 询 就 解决 了 问题 。Cypher 查 询 也 更 有 可 读 性 ， 并 且 
对 任何 了 解 该 领 域 应 用 的 人 来 说 更 易于 理解 ， 即 使 他 们 没有 任何 编程 技术 。 


O: 


在 本 章 中 ， 我 们 讨论 了 Cyphet 的 基本 概念 和 句法， 还 有 一 些 Cyphet 查 询 的 高 级 应 用 。 关 于 Cyphet 查 询 的 全 部 特性 可 以 参阅 
Neo4j 手 册 中 扩展 在 线 文件 httt 


现在 让 我 们 对 Cypher 查 询 做 一 个 更 深入 的 剖析 。 


Neo4D 图 形 数据 库 的 查询 遵从 标准 的 模式 : 查找 起 始 忆 点 并 且 运 行 遍历 。 到 目前 为 止 ， 在 所 有 的 遍历 中 ， 我 们 一 直 使 用 
Neo4j 核 心 API、 遇 历 API 和 Cypher 遵 从 这 个 模式 查询 。 可 以 通过 特殊 的 节点 编号 直接 得 询 以 定位 起 始 节 点 ， 或 者 使 用 Lucene 系 
引 查 找 ， 像 在 第 5 章 中 学 习 的 那样 。 首 先 让 我 们 回顾 一 下 通过 编号 直接 查找 。 


束 Cypher 查 询 而 言 ， 在 Cypher 查 询 的 开始 ， 在 关键 字 start 之 后 残 捐 定 了 起 始 古 点 。 在 前 面 的 例子 中 ， 到 目前 为 止 , 我 们 一 
直通 过 直接 编号 查找 加 载 起 始 节 点 ， 如 下 面 的 程序 所 示 。 


start john=node1{1) 
return john; 


| 在 Cypher 查询 中 通过 峭 号 使 用 


| -| 上 一 = 二 - | 4 -= 有 一 
直接 书 点 查找 街 到 起 始 节 后 


通过 在 node 关 键 字 后 面 的 圆 括号 中 简单 指定 编号 加 载 节 点 (@) 。 


如 果 有 一 个 起 始 节 点 ， 这 束 是 可 行 的 。 但 是 ， 有 了 时 需要 对 多 个 起 始 节 点 使 用 同样 的 模式 并 得 到 所 有 的 匹配 结果 一 一 例如 ， 
如 果 想 要 查找 John 或 者 Jack 看 过 的 电影 。 


2. 通 过 多 个 节操 编号 加 载 多 个 节操 


在 start 语 句 中 使 用 多 个 编号 ， 需 要 列 出 以 召 号 隔 开 的 编号 参数 值 ， 如 下 面 的 程序 所 示 。 


be 使 用 节点 编号 1 和 3 开始 
re Wi 
start Usger=nodell, 3) < 一 
nh 吝 上 七 襄 呈 号 到 下 :HAS 名 - yw] - 丁 FE i 
matcn J [:HAS SEEN| -SmoOVv1ie 出 1 | 中 指定 用 户 和 在 过 的 
return distinct movie 拍 回 找到 的 审 影 ， 和 不 和 所 有 电影 

播 重复 的 


start 语 句 中 使 用 单个 标识 符 指定 了 两 个 节点 编号 : user (人 @) 。 下 一 步 是 模式 匹配 查找 用 户 看 过 的 所 有 电影 。user 标 识 符 
引用 了 节点 1 或 节点 3， 因 此 该 模式 匹配 了 用 户 1 (这 里 是 John) 或 者 用 户 3 (Jack) 看 过 的 电影 。 输 出 的 结果 如 下 : 


INode [5] (name->1a1Lenmnr ype->nMovien 上 | 
INode [4] {name-»>"Fargo",type->"Movie"}| 


四 注意 


最 后 一 个 查询 的 tetutn 语 名 中 distinct 关 键 字 用 以 删除 重复 的 结果 。distinct 的 作用 与 SQL 查询 相同 一 在 结果 集中 排除 重复 的 


结果 。Jack 和 John 都 看 了 Fatgo， 此 ， 如 果 不 使 用 关键 词 distinct， 则 Fargo 将 在 结果 中 出 现 两 次 。 


但 是 ， 大 部 分 情况 下 ， 我 们 并 不 知 i 


首 感 兴趣 节点 的 节点 编号 一 一 可 能 知道 一 些 其 他 的 属性 ， 如 用 户 的 名 字 、 电 影 的 名 字 或 
其 他 一 些 相似 的 东西 。 在 下 一 节 ， 我 们 将 学 


学 习 如 何 使 用 这 些 信息 加 载 起 始 证 上 后。 
3. 使 用 索引 查找 起 始 节 点 


我 们 在 第 5 章 介 绍 了 索引 在 遍历 中 是 作为 推荐 的 方法 查找 起 始 节 点 。Cypher 也 支持 直接 访问 Lucene 索 引 ， 因 此 ，Neo4 中 
单 用 的 饥 历 木 语 便 成 为 : 


1) 使 用 Lucene 床 引 查 找 一 个 或 多 个 节点 。 

2) 从 步骤 1 中 找到 的 节点 开始 做 饥 历 。 

如 何在 Cypher 中 使 用 这 种 模式 ?Cypher 查询 通过 使 用 模式 匹配 工作 ， 因 此 ， 常 用 的 用 法 如 下 : 
1) 使 用 Lucene 床 引 查 找 一 个 或 多 个 节点 。 


2) 通过 将 从 步骤 1 中 找到 的 忆 点 附加 到 模式 中 做 模式 匹配 。 


现在 唯一 的 问题 是 如 何在 Cypher 查 询 的 start 语 句 中 做 Lucene 索 引 查 找 ， 而 不 是 通过 编号 加 载 节 点 。 这 非常 简单 ， 下 面 的 程 
序 做 出 了 演示 。 


start Johmn=node:usersliname = "John Johnson") 可 属性 “John Johnson” 的 
return john 和 


现在 的 start 语 句 句 法 稍微 有 一 点 不 同 。node: users 部 分 指定 了 一 个 感 兴趣 的 来 自 users 索 引 的 节点 。 当 给 索引 添加 节点 


时 ， 索 引 的 名 字 必 须 匹 配 使 用 的 索引 名 字 。 圆 括号 中 的 参数 指定 了 在 索引 中 查找 的 键 一 值 对 ; 在 这 种 情况 下 ， 匹 配 的 是 name 
属性 与 值 “John Johnson”。 如 果 这 样 的 索引 入 口 在 users 索 引 中 找到 ， 那 个 节点 将 从 Neo4j 数 据 库 中 加 载 并 在 Cypher 查 询 中 


使 用 。 


这 种 索引 查找 句法 需要 正好 键 - 值 对 的 匹配 ， 并 且 是 大 小 写 敏 感 的 ， 因 此 具有 name 属 性 “john johnson” 或 者 “John 
Johnso” 将 不 会 返回 。 同 时 ， 如 果 多 个 节点 以 同一 键 - 值 对 (如 果 在 数据 库 中 有 多 于 一 个 的 John Johnson) 索引 ， 所 有 匹配 的 
节点 都 要 加 载 ， 这 与 前 面具 有 多 个 节点 编号 的 例子 非常 相似 。 


如 果 使 用 Lucene 碍 询 的 完全 功能 查找 起 始 节点 ， 可 以 使 用 与 本 地 Lucene 原 始 查询 稍微 不 同 的 句法 。 


start John=node:users("name:John Johnson") "| 使 用 本 此 Lucene 查 


return John 询 索 引 青 措 凋 占 


这 个 例子 与 前 面 介绍 的 例子 完全 一 样 ， 唯 一 的 区 别 是 索引 查找 的 参数 。 这 一 次 所 有 的 索引 参数 都 传递 到 双 3 引 号 中 ， 并 且 包 合 
一 个 本 地 Lucene 查 询 。 这 人 允许 利用 强大 的 Lucene 查 询 结 构 ， 例 如 ， 通 配 符 或 多 属性 匹配 。 


名 注意 
关于 本 地 Lucene 查 询 功 能 的 文档 可 以 在 Lucene 网 站 上 找到 : http://lucene.apache.org/core/3_6_0/gqueryparsersyntax.html。 


这 里 是 在 使 用 Cypher 查 询 中 的 本 地 Lucene 查 询 。 


le 


start john=node:users ("name:John* AND vearOQfBirth<1980") return john 
从 John 开始 以 书 字 属性 且 出 生日 期 小 于 1980 年 进行 索引 查 


拱 所 有 市 后 (匹配 John Johnson、John Edwards 等 ) 


四 注意 


第 5 章 介 绍 的 自动 索引 也 能 够 以 同样 的 方法 用 作 Cyphetr 查 询 的 一 部 分 。 需 要 做 的 是 对 索引 名 字 使 用 节点 自动 索引 


9 一 户 


(node_auto_index) ， 而 不 是 前 面 查 询 中 的 对 usets 使 用 节点 自动 索引 。 
下 一 步 ， 让 我 们 看 一 看 如 何 对 标签 使 用 基于 模式 的 索引 在 Cypher 查 询 中 查找 起 始 节 点 。 


4. 使 用 基于 模式 的 索引 查找 起 始 节 操 


在 前 面 的 几 章 中 ， 我 们 讨论 了 如 何 通过 给 节点 指定 标签 确定 Neo4j 节 点 类 型 。 我 们 也 提 到 如 何 使 用 标签 作为 基于 模式 的 、 内 


置 泰 引 查找 图 形 。 也 可 以 使 用 同一 个 索引 在 Cypher 中 查找 节点。 
让 我 们 看 一 看 如 何 使 用 标签 通过 名 字 查 找 用 户 忆 点 。 
) 使 用 基于 模式 的 索引 结合 用 户 标签 查找 John 
Eo 节点 
match (john:USER) < pn 


an rs i | 本 本 | eb = = | eT es 上 站。 1 
wnere Jonn.name='Jonn Johnnson 了 在 where 语句 中 指定 索引 查找 查询 一 
return ] hn 让 二 


指定 使 用 模式 索引 的 标签 被 定义 为 节点 标识 符 的 一 个 部 分 ， 用 冒号 分 隔 (人 @) 。 必 须 在 圆 括号 内 放 一 个 与 标识 符 相 关 的 标 
签 。 索 引 查询 被 指定 为 where 语 句 的 一 个 部 分 ， 与 在 SQL 所 做 的 非常 相似 ( 甸 ) 。 


人 
Ht 
器 


基于 标签 的 索引 只 能 用 于 完全 属性 值 的 查找 。 对 全 文 的 搜索 ， 必 须 使 用 手动 方法 创建 索引 ， 就 像 前 一 节 讲 的 那样 。 


现在 ,我 们 知道 了 如 何在 Cypher 查 询 中 的 start 语 句 使 用 这 引 查找 节点 。 但 是 ， 在 执行 Cypher 查 询 时 ， 如 果 要 在 图 形 模式 中 
确定 多 个 节点 ， 并 要 求 对 它们 分 别 匹 配 时 应 如 何 做 ? 如 果 要 查找 John 和 Jack 都 看 过 的 所 有 电影 应 该 如 何 做 ? 使 用 Cypher 通 过 指 
定 多 个 不 同 的 起 始 节 点 作为 图 形 数据 库 入 口 点 也 是 很 容易 实现 的 。 


5.Cypher 查 询 中 的 多 个 起 始 节 点 


要 指定 图 形 数据 库 的 多 个 入 口 点 ， 可 以 在 Cypher 查 询 的 start 语 句 中 使 用 逗号 分 隔 列 表 ， 程 序 如 下 所 示 。 


担 定 但 号 阳 开 的 多 个 起 始 市 所 代表 
start ohn=node:users (name:John Johnson"), 用 户 John 和 Jack (合用 索引 查找 ) 
Jack=node :users ("name:Jack Jeffries') 
matcech John- [|:HAS SEEN| -smovie, Jack-|:HAS SEEN|] ->moVvie < 匹配 两 个 用 户 都 着 讨 
i te 本 返回 匹配 的 电影 的 电影 (起 始 节点 】 


起 始 节点 以 逗号 分 隔 列表 出 现 ， 每 一 个 节点 有 自己 的 标识 符 ， 这 个 标识 符 可 以 在 整个 查询 中 使 用 (@) 。 进 行 匹配 时 ， 所 
有 的 起 始 节点 可 以 用 作 单 个 模式 的 一 部 分 ， 或 者 可 以 像 在 本 例 中 用 作 独 立 的 模式 (@) 。 本 例 中 的 两 个 模式 都 是 movie 节 点 (在 
两 个 模式 中 具有 同样 的 名 字 ， 因 此 代表 同一 个 节点 ) ， 这 也 是 Cypher 查 询 的 结果 ( 合 ) 。 


6.2.3 “过滤 数 所 


使 用 Cypher 查 询 只 靠 起 始 节点 和 模式 有 时 并 不 足以 获得 需要 的 结果 。 人 在 一 些 情况 下 ， 需 要 对 节点 和 关系 再 做 一 些 过 渡 以 决 
定 返 回 哪些 结果 。 与 在 关系 数据 库 中 的 SQL 查 询 相 同 ，Cypher 查 询 过 滤 使 用 where 语 句 实现 。 


一 般 情况 下 ，where 语 句 基于 证 点 或 关系 的 一 些 属性 过 滤 结 果 。 让 我 们 看 一 个 例子 ， 查 找 用 尸 John 出 生 于 1980 年 后 的 所 有 
朋友 。 我 们 假设 每 一 个 用 户 厂 点 都 有 一 个 出 生年 (yearOfBirth) 的 整 型 属性 存储 用 户 的 出 生年 份 。 具 体 程序 如 下 所 示 。 


,0 过 引 查 找 用 户 John Johnson 
start JjJohn=node:usersl"name:John Johnson") 

match john- [|:IS FRIEND OF]- (friend) < 模式 匹配 John 的 朋友 
where friend.yearQftBirth > 1980 民 不 者 眠 查找 的 证 向 


先 择 1980 年 后 
return friend | sr 
返回 朋友 节点 出 生 的 朋友 


通过 索引 查找 寻找 起 始 节点 (@) ， 并 用 IS FRIEND_OF 关 系 模式 匹配 朋友 节点 ， 而 不 考虑 方向 (@) 。 下 一 步 ， 过 滤 匹 配 
了 的 朋友 节点 ， 找 出 生年 份 大 于 1980 的 朋友 节点 ( 合 ) 。 因 为 出 生年 份 具有 整 型 属性 ， 因 此 可 以 在 where 语 句 中 做 标准 的 数字 
比较 。 


对 于 字符 串 属 性 ， 除 标准 的 等 于 号 (=) 比较 外 ， 还 可 以 使 用 正则 表达 式 过 滤 掉 指定 的 值 。 例 如 ， 要 查找 所 有 邮箱 地 址 具 


有 “gmailcom” 的 朋友 ， 可 以 运行 下 面 的 查询 。 


和 


start John=node:usersl"name:John Johnason") 3 
match john-[:IS _ FRIEND QF] - (friend) z 
where friend.emalill =~ /.*@amall .com/ 


ll 


return frieTid 


如 上 所 示 ，Cypher 中 的 正则 表达 式 比 较 符 是 等 于 波浪 号 (=~) 。 正 则 表达 了 式 放 企 两 个 正 斜 杠 之 间 (/) 。 表 达 式 本 身 遵从 
标准 的 Java 正 则 表达 式 句法 (参看 http://docs.oracle.com/javase/tutorial/essential/regex/for more information) 。 


但 是 ， 如 果 所 有 的 用 户 或 匡 点 没有 存储 邮箱 地 址 ， 则 将 友 生 什么 情况 ? 束 像 我 们 以 前 寺 论 的 那样 ，Neo 泊 允许 半 结 构 化 、 无 
机 制 的 数据 结构 ， 因 此 没有 强制 两 个 节点 必须 有 相同 的 属性 。 本 书 例子 的 数据 集 有 些 user 古 点 具有 email 属 性 ， 但 并 不 是 都 有 。 
让 我 们 看 看 如 何 使 用 Cypher 查 询 并 不 是 所 有 节 点 都 具有 的 属性 。 


要 过 滤 具 有 给 定 属性 的 节点 而 不 管 属性 的 值 ( 例 如， 有 具有 Twitter 账 号 的 所 有 朋友 ) ， 则 需要 使 用 Cypher 的 has 消 数 。 
start john=node:users{('"name:John Jonnson") 


match john- [IS FRIEND OF] -friend 
where hastfriend.twitter) 


性 的 节点 


returrn frierid 
正如 所 看 到 的 ， 在 Cypher 中 过 滤 结 果 并 不 困难 ， 看 上 去 与 SQL 的 where 语 句 非 音 相似 。 
在 下 节 中 ， 我 们 将 看 看 Cypher 查 询 中 能 返回 的 不 同类 型 的 结果 。 

6.2.4 ”获得 结果 


Cypher 查 询 的 结果 用 return 语 句 返 回 。 到 目前 为 止 ， 我们 已 经 使 用 它 返 回 了 感 兴趣 的 节点 ， 但 是 return 语 句 不 仪 仪 能 返回 
节点 一 一 也 可 以 返回 关系 、 节 点 和 关系 的 属性 ， 甚 至 子 图 形 的 整个 路 径 。 


四 注意 


Neo4j 的 路 径 代 表 通 过 关系 连接 的 节点 集 ， 例 如 ，hodel - [: telationship1]-node2 - [: relationship2]-node3。 


1. 返 回 属性 
在 前 面 的 例子 中 ， 使 用 Cypher 查 找 John 的 朋友 已 经 看 过 但 John 没 有 看 过 的 所 有 电影 ， 并 且 返 回 了 匹配 的 movie 节 点 。 如 果 


使 用 这 些 数据 在 网 页 上 显示 推荐 的 电影 名 字 ， 则 应 该 返回 具有 所 有 属性 的 整个 movie 节 点 一 一 比 需要 的 数据 还 多 。 更 好 的 方法 是 
仅仅 从 查询 中 返回 感 兴趣 的 node 属 性 。 


下 面 的 程序 做 出 了 演示 : 


start John= node:usergslname = "John Johnson") 

match 

John-[:IS FRIEND OF] -sl(user}—-[:HAS SEEN] -> (movie) 
where not John- [:HAS SEEN] -> (movie) - 


et mov] [= 


例如 ， 如 果 从 Neo4 Shell 运 行 该 程序 ， 程 序 的 输出 结果 将 比 以 前 看 到 的 简单 得 多 


| "Alien" 
| "Heat" 


全 注意 
如 果 引 用 的 属性 并 不 是 结果 集中 的 所 有 实体 都 具有 ， 那 对 不 具备 引用 属性 的 实体 将 返回 null。 


2. 返 回 关 系 


有 时 查询 图 形 数据 库 中 的 某 些 关 系 是 合理 的 。 假 设想 显示 一 个 用 户 对 看 过 电影 的 评级 ， 评 级 是 HAS_SEEN 关 系 的 一 个 属性 
(实际 属性 名 是 stars， 代 表 给 予 电 影星 的 数量 ) ， 因 此 需要 返回 这 些 天 系 。 下 面 的 程序 做 出 了 演示 。 
返回 John 看 过 的 电影 ， 标 识 
乌 七 总 John=node: :USeErSs (name:John Johnson') 符 设置 为 HAS SEEN 关系 [ 工 ) 
match John- [r:HAS SEEN] - (movie) < 


return ri 
返回 被 标识 符 引 用 的 关系 


查询 通过 从 索引 查找 用 户 John Johnson 开 始 并 匹配 所 有 他 看 过 的 movie 节 点 (人 @) 。 然 后 返回 例子 中 的 HAS SEEN 关 系 。 
注意 要 返回 一 个 关系 ， 需 要 有 一 个 标识 符 (这 里 是 r) 。 


这 个 查询 的 输出 结果 如 下 所 示 : 
:HRS SEEN [2] ‘stars-»>5}) | 


如 果 只 对 关系 属性 的 星 级 感 兴趣 ， 可 以 仅仅 从 得 询 中 返回 那个 属性 。 融 像 世 点 属性 一 样 ， 天 系 属性 可 以 在 return 语 句 中 引 


反 情 兴 
用 。 下 列 的 程序 演示 了 这 一 用 法 。 
start John=node:usersl"name:John Johnson") a | 
区 a 让 回 HAS SEEN 关系 的 星 朗 
match John- [r:HAS SEEN] - (movie) i 一 
属性 


return I. Stars 


一 次 不 是 整个 关系 实体 ， 而 是 仪 仪 返回 了 感 兴趣 的 stars 属 性 。 


除 节点 和 属性 外 ， ee 例如 ， 当 要 基于 John 的 朋友 看 过 的 电影 推荐 电影 时 ， 可 能 对 每 一 部 
影 是 如 何 被 推荐 的 感 兴 趣 ， 这 样 可 以 从 开始 的 用 户 节 点 ， 通 过 所 有 的 朋友 到 推荐 的 电影 ， 返 回 整个 路 径 。 下 面 的 程序 对 这 一 方 


法 做 了 演示 : 
start john=node:users (name = "John Johnson") 冶 上 路径 以 标识 符 
match i i eed 
recPpath = ohn-[:IS FRIEND OF|] -» (user)-=- [:HAS SEEN|] -= (movie) 
TS ER OE ae LR SEN 任何 地 方 者 可 以 
where not john-[r:HAS SEEN] -> (movie) 
村 用 


所 回 引 町名 路 径 太 了 其 
return movie.name, recPath. < 
相 才 的 电影 甩 罕 


要 返回 路 径 作为 查询 的 结果 ， 将 需要 给 它 一 个 标识 符 并 能 对 它 做 出 引用 (@) 。 那 么 ， 在 return 语 句 中 通过 指定 标识 符 就 可 
以 返回 引用 的 路 径 。 


返回 的 路 径 输 出 将 包含 属于 它 的 所 有 节操 和 关系 : 


"Alien" 
[ 
Node [1 ] | 
name->"John Johnson", 
year of birth->1982, 
type->"User" 


}, 


:IS FRIEND OF [1] 1{}, 
Node [3] { 
name—>"Jack Jeffries'", 
cars Owned->[Lijava.1lang.String;®3927ff0d,type->"User" 


| 
二 


:HAS SEEN[S] {stars->5}, 
Node [5] 1 


name->"Allen",type->"Movie" 


] | 
| "Heat" 
| 1 
Node [1]{ 
name->"Jonn Jonnson", 
Vear Of birth->1982, 
type->"User" 
is 
:IS FRIEND OQF[0] 1{} 
Node [2] 1 
name->"Kate Smith", 
locked->true,type->"'User" 


二 


| 


:HAS SEEN[3] {stars->3}, 
Node [6] {name->"Heat",type->"Movie") 


] | 
人 注意 


在 前 面 的 例子 中 ， 从 Cypher 查 询 返回 了 一 个 node 属 性 和 一 个 路 径 。 这 里 讨论 的 所 有 可 返回 的 图 形 实 体 可 以 被 任意 组 合 指定 。 


当 在 屏幕 上 显示 或 在 纸 上 打 印 数 据 时 ， 通 党 并 不 想 一 次 显示 所 有 的 结果 ， 而 是 把 它们 分 为 数 页 以 便 更 为 可 读 或 可 用 。 下 面 将 
要 介绍 如 何 对 Cypher 查 询 的 结果 分 页 。 


二 人 网 结果 


结果 中 包 合 很 多 实体 ， 需要 将 结果 分 成 几 页 以 显示 在 网 页 上 。 要 对 Cypher 查 询 结果 进行 分 页 ，Neo4j 有 三 个 简单 明了 
的 语句 。 


.oftdeft 一 一 在 分 页 之 前 ， 对 结果 进行 排序 ， 因 此 分 页 返回 的 结果 是 一 致 的 ， 无 论 是 往 前 还 是 往 后 分 页 。 


、 


skip 一 一 划分 结果 集 以 便 跳 到 指定 的 页 。 


“ limit 一 一 以 页 面 尺寸 限制 返回 结果 的 数量 。 


假设 数据 库 中 的 一 个 用 户 是 一 个 电影 迷 ， 他 看 过 并 评级 了 上 下 部 电影 ， 如 果 想 在 一 页 上 显示 这 个 用 户 评 价 的 所 有 电影 (给 定 
的 星 级 ) ， 则 显示 的 字 型 将 小 的 无 法 阅读 (或 者 根本 容纳 不 下 ) 。 


可 以 确定 以 电影 名 字 排序 ， 每 一 网 页 只 显示 10 部 电影 。 要 查询 图 形 数据 库 得 到 这 样 分 页 的 结果 ， 需 要 使 用 order、limit 和 
skip 语 句 。 下 面 的 查询 返回 了 第 三 页 (21~30 项 ) 。 


start John=node:users('name:Johnn Johnson'") 
match John- |L:HAS SEEN]-» (moVvie) 1 
return movie | 
order by movie.name 


Skip 20 相 跳 过 量 前 面 的 两 页 
limit 10 返回 40 小 结果 (2x10-20 项 ) 


就 像 我 们 讨论 过 的 ， 匹 配 了 这 个 用 户 看 过 的 电影 后 ， 通 过 name 属 性 对 结果 进行 排序 (@) 。 因 为 对 结果 的 第 三 页 感 兴趣 ， 
所 以 跳 过 前 两 页 共 20 项 (@) 。 最 后 ， 限 制 返回 的 结果 集 为 页 面 的 大 小 (本 例子 中 是 10) 。 


四 注意 


Neo4j 在 线 手 册 包 括 了 一 份 方便 打印 的 Cyphet 参 考 卡 ， 卡 中 有 常用 句法 和 详细 的 查询 : http://neo4j.org/tesources/cypher。 
Cypher 性 能 


在 简单 的 查询 中 ， 可 以 看 到 Cyphet 查 询 的 性 能 与 Neo4j 遍 历 API 或 JavaAPI 大 体 相 同 ， 但 是 当 运 行 更 复杂 的 查询 时 (具有 复杂 
的 模式 匹配 或 密集 的 过 滤 ) ，Cyphet 查 询 的 性 能 不 如 Neo4j 遍 历 API 或 Java API 的 性 能 。 在 有 些 情况 下 ， 差 距 会 有 一 个 数量 级 或 更 
大 


由 于 Cypher 非 常年 轻 ， 它 的 开发 者 首先 着 重 于 添加 需求 的 功能 ， 性 能 并 没有 优先 考虑 。 然 而 ， 到 了 Neo4j 2.0，Cypher 绑 定 到 
了 Neo4j 引 擎 比 遍历 API 低 的 栈 中 。 这 将 使 得 细微 调整 Cyphet 性 能 以 好 于 遍历 API 成 为 可 能 。 一 旦 这 个 特性 组 成 为 稳定 的 ， 那 么 
Cypher 解 析 器 的 性 能 和 执行 引擎 的 调节 可 能 将 会 产生 更 好 的 结果 。 


鉴于 其 简单 性 和 描述 性 ， 对 于 大 部 分 的 图 形 查 询 ，Cypher 是 最 好 的 选项 。 但 是 对 非常 复杂 的 遍历 或 插入 一 个 大 的 数据 集 ， 可 
能 要 使 用 核心 JavaAPI 和 遍历 API 了 。 我 们 在 第 3、 第 4 和 第 5 章 讨 论 了 核心 Java API 的 基础 知识 。 对 更 深入 的 遍历 API 的 讨论 ， 参 见 
第 8 章 。 在 未 来 版 本 的 Neo4j 中 ， 可 以 期 待 Cypher 将 成 为 最 有 效 和 最 快 的 与 Neo4j 交 互 的 方法 。 


现在 已 经 介绍 元 了 Cypher 人 句法 ,我们 学 会 了 如 何在 Cypher 中 进行 模式 匹配 ， 如 何 过 渡 结 果 ， 如 何不 仅 返 回 节点 还 直接 返回 
图 形 实体 ， 如 何 排序 和 限制 返回 的 结果 集 等 。 


到 目击 为 止 我 们 的 讨论 一 直 与 从 Neo4j 旋 数据 相 天 。 在 下 一 六 中 ， 我 们 将 进 解 如 何 使 用 Cypher 创 建 、 更 新 和 删除 图 形 数 


据 。 


6.3 ”用 Cypher 更 新 图 形 数据 


从 Neo4j 1.7 开 始 ， 束 可 以 使 用 Cypher 对 图 形 数据 库 运 行 变更 操作 如 创建 、 更 新 、 删 除 忆 点 与 关系 以 及 它们 的 属性 。 
变更 操作 的 句法 是 非常 直观 的 ， 因 此 让 我 们 看 几 个 例子 。 
全 注意 
Cyphet 图 形变 更 操作 是 一 个 Neo4j 数 据 库 相对 新 的 特性 ， 因 此 ， 变 更 的 多 法 在 未 来 发 布 的 版 本 中 可 能 会 有 较 大 的 变化 。 本 书 
是 基于 Neo4j 2.0 版 的 Neo4j 名 法。 建议 读者 参考 最 新 版 本 的 句法 手册 (http://docs.neo4j.otg/chunked/stable/quety-wtite.html) 。 


让 我 们 从 创建 节点 和 天 系 开 始 。 
6.3.1 创建 新 图 形 实体 


要 创建 一 个 具有 属性 的 节点 ， 可 以 使 用 以 下 的 句法 : 


使 用 create 其 键 字 ,跟着 节点 标 
CIeate Newuser 


< 识 符 开 始 科 在 花 括 号 | | 
| 人 里 指定 属性 


I I ny 二 上 > 有 7] :dd er A - a 
Name: Grace SDencer', 2 对 每 一 沾 属 性， 指定 一 个 当 字 和 值 
YearDOtBITtP: 1982, 1 开 


emalil: grace@m vceomparny,. com 


| 


泽 加 一 个 
return Newuser:; 可 撤回 新 创 
建 的 市 点 


创建 (create) 图 形 实体 命令 ， 并 不 令 人 吃惊 ， 就 是 create 跟 着 节点 标识 符 (人 @) 。 紧 接着 ， 指 定 一 个 用 冒号 分 隔 的 属性 列 
表 加 到 节点 上 ， 用 人 花 括 号 括 着 (@) 。 每 一 个 属性 用 它 的 名 字 指 定 ， 跟 着 一 个 冒号 和 一 个 属性 值 ( 合 ) 。 字 符 串 属性 值 以 单 引 
号 括 着 ， 但 是 数值 和 布尔 属性 不 需要 任何 引号 ( 信 ) 。 最 后 ， 使 用 它 的 标识 符 返回 新 创建 的 节点 ， 就 像 在 前 面 的 Cypher 例 子 一 
样 。 


现在 已 经 创建 了 一 个 节点 ， 那 么 如 何 创建 一 个 关系 呢 ” 让 我 们 使 新 创建 的 用 户 Grace 成 为 John 的 朋友 。 


start John = node:users(lname = "John Johnson"),; grace = DoadeIO | 点 参与 到 关系 
create John- [r:IS FRIEND OF] ->grace 二 Pi 
return 工 ; 在 的 节点 和 和 关系 之 间 

| 创建 路 得 


要 想 在 已 存在 的 两 个 节点 之 间 创 建 一 个 天 系 ， 需 要 首先 引用 它们 。 这 个 操作 与 在 只 读 查 询 中 指定 起 始 太 点 完全 一 样 ， 使 用 


w\ID 
start 语 句 和 节点 查询 (@) 。 下 一 步 ， 在 create 语 句 中 ， 简 单 地 指定 图 形 路 径 作为 模式 通过 它们 的 标识 符 引 用 起 始 节 点 并 且 设 
置 在 它们 之 间 想 要 创建 的 关系 (@) 。 


Cypher 和 事务 


当 从 命令 行 或 网 页 界面 运 和 EO 含 于 一 个 事务 中 。 不 必 担 心事 务 的 开始 和 完成 或 处 理 它们 的 失败 
一 一 所 有 的 事务 都 由 Neo4j 引 擎 负责 。 如 果 查 询 成 功 ， 则 事务 就 会 自动 提交 ， 如 果 查 询 失败 ， 事 务 就 会 回 滚 。 


就 应 用 程序 来 说 ，Cypher 查 询 将 会 与 已 经 存在 的 事务 一 起 执行 。 如 果 由 程序 创建 事务 ， 则 可 以 在 同一 个 事务 中 使 用 多 个 查 
询 ， 并 在 事务 的 最 后 提交 或 回 滚 每 一 个 事项 。 


因为 在 本 章 中 我 们 正在 使 用 Neo4j Shell 或 网 页 管理 控制 台 运 行 Cypher 查 询 的 例子 ， 每 一 个 查询 自动 包 训 到 了 一 个 单一 的 事物 
中 ， 因 此 不 需要 额外 的 设置 。 


关于 Neo4j 事 物 的 更 深层 次 信息 ， 请 阅读 第 7 章 。 


到 目前 为 止 , 已 经 创建 了 一 个 具有 一 些 属性 的 节点 和 一 个 关系 。 但 是 可 以 用 一 个 命令 完成 所 有 的 这 一 切 ， 就 像 下 面 程序 演示 
的 一 样 : 


start ohn = node:users (name = "John Johnson") rE 
a 了 咽 1 
create John 指 是 起 始 节 点 代表 John 
- [YY:IS FRIEND OF] -> 
【二 + 和 
上 上 电 太志 | 由 呈 上 站 上 点 
niame: Grace SPpencer’ 7 


YearOftBirth: 1982, email: 'graceBmycompany .com' < 新 市 局 


和 
! 


return r, grace; 


在 本 例 中 ， 固 定 一 个 已 经 存在 的 节点 john (人 @@) 。 在 create 语 句 中 ， 指 定 了 一 个 通过 不 存在 的 IS FRIEND_ OF 关系 从 john 到 
一 个 不 存在 的 节点 grace 的 模式 ， 同 以 前 一 样 ， 具 有 相同 的 属性 (@) 。Cypher 陪 明 地 知道 哪个 节点 和 关系 是 固定 的 (start 语 
句 中 的 john) ， 哪 个 是 新 的 并 且 应 该 在 数据 库 中 创建 (IS_FRIEND_OF 天 系 和 grace 忆 点 ) 。 这 是 一 个 具有 强大 功能 的 ， 可 以 创 
建 具有 属性 的 新 节点 和 关系 的 整个 路 径 的 方法 。 


Cypher create 语 句 将 创建 匹配 模式 中 的 所 有 元 素 ， 而 不 省 它们 是 否 仓 在 。 如 果 运 行 前 面 的 节点 程序 ， 创 建 了 John 的 朋友 
Grace Spencer 两 次 ， 将 得 到 两 个 Grace Spencer 节 点 和 两 个 从 John 节 点 的 |S_FRIEND_OF 关 系 。 这 可 能 不 是 想 要 的 结果 。 要 只 
创建 不 存在 的 图 形 实体 ， 应 该 使 用 创建 唯一 的 (create unique) Cypher 命 令 ， 下 面 的 程序 作 了 演示 。 


start John = node:users (name = Wohn Johnson") 
create unligque John 
- [r:IS FRIEND OF] -> 
(grace 1 
name: ‘Grace SPpencer 
VearOftBirth: 1982, emall: 'graceBmycompany .com! 
用 


TetUuUrn rr, grace; 


对 前 面 例子 的 唯一 改变 是 使 用 create unique 命 令 。 多 次 运行 这 段 程序 将 不 会 产生 实体 数 的 乘积 
Spencer 节 点 和 一 个 在 John 和 Grace 节 点 之 间 的 |S FRIEND OF 关系 。 


将 总 是 有 一 个 Grace 


现在 知道 了 如 何 创建 新 节点 、 新 关系 和 新 属性 ， 但 是 ， 生 样 删除 它们 呢 ”下面 将 会 过 论 从 Neo4j 使 用 Cypher 删 除数 据 。 


6.3.2 ”删除 数据 


要 删除 节操 ，Cypher 提 供 了 一 个 delete 命 令 。 让 我 们 删除 刚刚 创建 的 用 尸 书 点 Grace。 


] 使 用 start 语 仙 选 择 
证 者 Ee HF 上 
Start grace = Tiode (ll10) | 和 删 [半日 下 机. 
I 训 使 用 delete 谷 邻 删除 
选择 的 节点 
但 是 ， 运 行 这 个 命令 将 会 出 错 ， 和 警告 节点 具有 关系 。 在 Neo4 中， 只 能 删除 没有 任何 关系 的 节点 (无论 是 进 还 是 出 的 关 
系 ) 。 要 明确 的 是 删除 一 个 节点 ， 同 时 也 会 删除 它 的 关系 ， 如 下 面 的 程序 所 示 : 
start grace = nodet10) 多 到 过 挟 节 点 的 所 有 关系 ， 不 考 由 内 
match grace- [r] - () e 
人 同时 贡 除 关系 和 节点 


这 里 使 用 了 标准 模式 匹配 grace 节 点 的 进 或 出 的 所 有 关系 (@) ， 并 且 删 除了 指定 节点 的 开始 或 结束 的 所 有 关系 (@) 。 


delete 香 询 的 输出 不 包含 任何 数据 ， 但 是 将 所 出 删除 的 节点 和 关系 数 : 


Nodes deleted: 1 
Relationships deleted: 1 


最 后 ， 让 我 们 看 看 如 何 使 用 Cypher 更 新 已 存在 节点 的 属性 。 


6.3.3 ”更 新 厂 上 和 关系 属 性 


假设 John 的 出 生日 期 有 错误 ， 需 要 对 其 进行 更 新 。 完 成 这 一 工作 的 命令 如 下 : 


0 选择 要 更 新 的 节操 
start JONn=nOde :USers (name = "Jonn Johnsoen') 4 


诗 呈 更 证 部 上 员 属 机 
Set john.vearOfBirth = 1973 让 = 设置 要 于 新 的 属性 


可 以 看 到 句法 非常 简单 : 首先 选择 要 更 新 的 节点 (人 @@) ， 然 后 使 用 set 命 令 设置 选择 节点 的 属性 并 给 予 新 值 。 如 果 要 设置 的 
属性 并 不 存 企 ， 将 会 创建 这 一 属性 。 


可 以 选择 多 个 证 点 添加 同一 属性 : 


start user=node{l1,2) 
Set user .group = "ADMINISTRATOR' 


Neo4j 不 允许 图 形 实体 具有 空 (Null) 属性 值 。 事 实 上 ， 空 属性 值 认 为 是 不 存在 的 属性 。 因 此 ， 如 果 想 要 删除 一 个 属性 ， 将 
使 用 delete 命 令 。 下 面 的 程序 做 出 了 演示 : 


Start n=sTiGdell) 


de lete n.dgroup:; 


Cypher 中 的 图 形变 更 操作 是 在 本 书 的 写作 时 Neo4j 的 一 个 相对 较 新 的 特性 。 我 们 已 经 演示 了 一 些 有 用 的 例子 帮助 理解 。 天 
于 更 多 和 最 新 涉及 Cypher 句 法 的 信息 ， 可 以 在 下 面 网 页 查 疝 Neo4j 手 册 : http://docs.neo4j.org/chunked/stable/cypher- 
query-lang.html, 


Cypher 中 的 模式 索引 
在 第 5 章 中 ， 我 们 介绍 了 模式 索引 的 概念 ， 并 且 改 进 了 Neo 和 j 自 动 索引 的 特性 ， 那 里 有 Neo4j 引 擎 完全 维护 索引 作为 节点 生命 


周期 的 一 个 部 分 ， 也 学 会 了 如 何 从 Java 代 码 使 用 模式 索引 ， 此 外 ， 也 可 以 从 Cypher 做 模式 索引 操作 。 


模式 索引 所 需 的 Cyphert 句 法 的 详细 描述 超出 了 本 书 的 范围 ， 但 是 可 以 参考 Neo4j 手 册 获 得 详细 的 信息 


(http://docs.neo4j.org/chunked/stable/gquery-schema-index.html) 。 


注意 Neo4j 的 变更 操作 不 支持 手动 创建 索引 的 更 新 。 如 果 需 要 对 新 创建 的 节点 使 用 自 定义 (不 是 模式 索引 ) 索引 ， 则 必须 使 
用 Neo4j 核 心 JavaAPI、 语 言 绑 定 或 者 REST APTI。 


到 目前 为 止 ， 有 关 Cypher 我 们 已 经 讨论 了 很 多 ,但 是 ， 还 有 更 多 。 下 一 节 ， 我 们 将 探讨 一 些 有 关 Cypher 更 好 的 东西 。 


6.4 ”高 级 Cypher 


目前 我 们 已 经 学 会 编写 相当 复杂 的 Cypher 查 询 ， 但 是 Cypher 功 能 远 远 不 止 这 些 。 在 本 节 中 ， 我 们 将 讨论 一 些 Cypher 中 的 
高 级 功能 ， 例 如 数据 聚合 、Cypher 函 数 和 链 式 多 个 查询 等 。 让 我 们 从 数据 聚合 开始 吧 。 


束 像 在 SQL 中 的 GROUP BY 一 样 ，Cypher 又 持 理 询 中 的 聚合 国 数 。 不 是 使 用 一 个 专用 GROUP BY 语句 ，Cypher 中 的 分 组 天 
键 词 被 定义 为 所 有 的 查询 非 聚 合 结果 。 下 面 的 程序 展示 如 何 计算 图 形 数 据 库 中 每 一 个 用 户 的 朋友 数 : 


投 所 有 有 书 使 用 工 S_FRIEND_OF 关系 
start usger=node (*) < 中 的 所 有 节操 9 轴 人 re ee 


match user- [:IS FRIEND QF]-() 


return USer, COouUnt (*) < 由 用 户 茸 占 为 组 叛国 
i 月 卜 : 二 站 PE Pe | "ll = 
Srder bB COUNnt i) desc: | | 
和 J : 二。 全 且 有 及 和 赤 朋 友 的 用 用 友 数 
ie 有 De Be 省 Pa 
| 本 | | 生 喇 - 下 " I- 
户 和 在 第 业 中 磊 在 前 面 


在 本 例 中 查找 了 整个 图 形 数据 库 ， 因 此 ， 所 有 节点 都 作为 起 始 节点 (人 @@) 。 对 每 一 个 user 节 点 ， 通 过 跟随 一 级 
IS_FRIEND_OF 关 系 匹 配 他 们 的 直接 朋友 (@@) 。return 语 句 包含 一 个 非 聚合 条 目 (user 节 点 ) 和 一 个 聚合 函数 (count) (@ 
) 。 这 意味 着 在 使 用 user 节 点 分 组 结果 ， 使 每 一 个 用 户 的 结果 为 一 行 。 也 可 以 在 order by 语句 中 使 用 聚合 值 排序 整个 结果 集 (@ 
) 。 


除 count 函 数 外 ，Cypher 支 持 SQL 的 所 有 常用 的 聚合 函数 : SUM 的 数值 求 和 、AVG 计 算 平 均值 到 MAX 和 MIN 寻 找 数 值 属性 
中 的 最 大 信和 最 小 值 。 


要 求 John 所 有 朋友 的 平均 年 龄 ， 可 以 使 用 以 下 查询 : 


match John- [|:1S8 FRIEND OQF|- {fr1iend) 
where HAS'‘'friend.vearOtBirth,) 


start John=node:users {name = "John Johnson") 了 确保 节 所 具有 
return avgli2014=ftriend.vyearotBirth,)., 让 合用 鸟 3 函数 


收回 平均 年 齿 
在 用 于 数学 计算 之 前 ， 这 里 检查 了 这 个 节点 具有 一 个 出 生年 的 属性 设置 (@) 。 然 后 返回 计算 的 平均 值 (@) 。 
对 注意 
要 得 到 用 户 的 平均 年 龄 ， 用 现在 的 年 份 减 去 出 生 的 年 份 。 在 本 例 中 ， 我 们 使 用 了 本 书 的 出 版 年 。 
现在 让 我 们 看 一 下 Cypher 的 内 置 函 数 。 
6.4.2 ”函数 


Cypher 逐 持 多 项 尔 数 可 用 于 人 在 坦 询 中 计算 表达 式 ， 让 我 们 看 看 其 中 的 一 些 。 


Cypher 遂 数 用 于 访问 图 形 实体 的 内 部 属性 ， 例 如 证 点 和 关系 的 编号 和 节点 标签 (类型) 。 在 计数 的 例子 中 ， 已 经 看 到 了 用 
ID (node) 遂 数 获取 指定 节点 的 内 部 编号 。 另 外 ， 也 可 以 使 用 TYPE (relationship) 了 国 数 查找 一 个 关系 的 类 型 。 


为 了 演示 TYPE 消 数 的 使 用 ， 让 我 们 对 下 面 的 问题 寻找 答案 : “每 一 类 型 有 多 少 个 关系 开 始 于 或 结束 于 用 户 John? ”,， 下面 
的 程序 给 出 了 实现 这 一 功能 的 Cypher 查 询 : 


jj | 二 -ji LL 上 上 
-0 查找 起 始 节点 
start n=niode:users (name= JOoONnn Jonnson) 4 号 配 起 始 革 点 的 所 灌 
B= = -一 ， = 1 | 
a tl 了 [Yel| { 用 节 占 | 更 用 rl IE -i 
return TYFPE (rel}, count  (*).: < Rt 
度 癌 以 节点 类 型 成 组 的 尖 要 标识 殖 
= 让 FREE Me ee- 一 本 | | 让 | 四 | 
每 一 类 庆 系 的 数量 


本 例 中 的 前 两 步 非常 熟悉 ， 使 用 索引 查找 表 查 找 起 始 节 点 (人 @) ， 并 且 使 用 match 语 句 匹 配 查找 所 有 的 邻居 节点 (@) 。 
在 以 后 的 查询 中 使 用 标识 符 rel 引 用 每 一 个 关系 。 最 后 ， 使 用 TYPE 函 数 返回 每 一 个 关系 的 类 型 与 其 数量 (个 ) 。 由 于 TYPE 是 一 个 
非 聚 合 函 数 ， 结 果 将 会 以 天 系 类 型 分 组 。 


Cypher 也 文 持 一 些 这 样 的 为数 ， 可 以 在 查询 内 以 可 和 迭代 集 的 方式 方便 地 查询 。 作 为 一 个 例子 ， 让 我 们 解决 下 面 的 问题 : 
John 希 望 在 Facebook 上 介绍 给 Kate。 他 不 认识 Kate， 但 是 想 找 出 谁 是 Kate 的 朋友 ， 朋 友 的 朋友 认识 她 ， 直 至 第 三 层 的 朋友 。 
因为 他 需要 使 用 Facebook， 所 以 他 仅仅 对 Facebook 上 的 人 ( 即 有 Facebook ld 属性 设置 的 人 ) 感 兴趣 。 下 面 的 程序 给 出 了 需 
要 的 查询 : 


1 i . Ep el 直 ; | Js Li 所 
start John=node:usergs name = "Jonn Jonnson'")., 了 请 记 生子 恒 用 过 J 所 
I 


Kate= niode :Users lname = "Kate Smithn'"), 

matceh p=john- [:IS FRIEND OF*1., .3|- (Katel | A 

where ALLI' i 匹配 通过 第 1 至 第 3 
user in NODES (p) 的 IS_FRIRND_OF 庆 
where HAS'(user.facebookId) 检查 一 小 选择 的 具有 系 连 接 John 至 Kate 的 
Facebook 峰 号 尾 性 集 所 用 路径 

return 六 ; 路径 上 的 所 A 节 鼎 : 

返回 匹配 的 路 径 


通过 在 Neo4j 数 据 库 中 定位 知道 的 代表 John 和 Kate 的 起 始 节点 开始 查询 (人 @) 。 在 match 语 句 中 ， 将 会 找到 通过 
1S_FRIEND_OF 关 系 连接 John 和 Kate 的 所 有 路 径 ， 直 到 关系 的 第 3 级 (人 @) 。 在 后 面 的 查询 中 使 用 标识 符 p 引 用 匹配 了 的 路 径 。 


智能 位 来 自 于 where 语 句 (个 ) 。 使 用 NODES (p) Cypher 函 数 提取 给 定 路 径 上 的 所 有 节点 集 。 使 用 HAS 函 数 检 查 每 一 个 
廿 点 是 否 有 facebookld 属 性 。 然 后 使 用 ALL 阔 数 对 节 避 集 中 的 每 一 个 元 素 使 用 HAs 函 数 。 如 果 在 给 定 的 可 友 代 集中 每 一 个 元 素 
匹配 了 HAS 涪 数 的 定义 ，ALL 消 数 将 会 返回 true， 因 此 ， 如 果 在 路 径 p 上 的 一 个 市 点 没有 facebookld 属 性 ， 这 条 路 径 将 被 放弃 。 


最 终 ， 返 回 了 符合 所 有 标准 的 路 径 (全 ) 。 这 些 路 径 包 含 所 有 John 将 要 联系 的 人 ， 因 此 他 可 以 在 Facebook 上 被 推荐 给 
Kate。 


在 本 例 中 ， 阔 数 的 使 用 如 下 ， 这 只 是 很 少 的 几 个 阔 数 : 


* HAS (graphEntity.propertyName) 如 果 一 个 节点 或 关系 具有 给 定名 字 的 属性 存在 ， 则 返回 true。 


-NODES (path) 一 一 把 一 个 路 径 转 换 成 一 个 可 和 迭代 的 节点 集 。 


ALL (xin collection whete predicate (x) ) 如 果 collection 中 的 每 一 个 单个 元 素 匹 配 了 给 定 的 predicate， 则 返回 true。 


Neo4j 支 持 许多 具有 相似 目的 的 函数 。 例 如 ， 与 NODES (path) 函数 类 似 、RELATIO ”NSHIPS (path) 函数 返回 在 一 个 
给 定 路 径 上 的 所 有 节点 集 。 


除 ALL 函 数 外 ，Neo4j 也 支持 其 他 一 些 基 于 谓词 表述 的 布尔 函数 : 


+ NONE (xin collection whete predicate (x) ) 如 果 提 供 的 集合 中 没有 元 素 匹 配 谓 词 表 述 ， 返 回 true; 否则， 返回 false。 


+ ANY (xin collection where predicate (x) ) 一 一 如 果 至 少 有 一 个 元 素 匹 配 谓 词 表述 ， 返 回 ttue;i 如 果 没 有 匹配 的 ， 返 回 


false。 


如 果 正 好 有 一 个 元 素 匹 配 谓词 表述 ， 返 回 true; 如 果 没 有 或 多 于 一 个 匹 


* SINGLE (xin collection where predicate (x) ) 


丁 C 的 ? 这 个 县 数 返 回 false O 
名 沪 


本 书 没 有 足够 的 篇 幅 详细 讨论 所 有 的 Neo4j 函 数 。 相 关 的 更 多 信息 ， 请 参阅 Neo4j 手 册 
(http://docs.neo4j.org/chunked/stable/gquery-function.html) ) 。 


6.4.3 ”with 语句 的 管道 功能 


在 Cypher 中 ， 可 以 将 一 个 查询 的 输出 链接 到 另 一 个 查询 中 ， 从 而 创建 功能 强大 的 图 形 结构 。Cypher 中 的 链 (或 管道 ) 语句 


是 with。 


为 了 演示 它 的 用 法 ， 让 我 们 在 前 面 例子 的 基础 上 来 演示 ， 在 前 面 的 例子 中 使 用 Cypher 统 计 从 john 节 后 的 每 一 类 关系 的 数 
量 。 让 我 们 添加 一 个 需求 ， 仅 包含 出 现 多 于 一 次 的 关系 : 如 果 John 已 经 看 了 两 部 电影 ， 应 该 包含 HAS_SEEN 关 系 ， 但 是 如 果 他 
只 看 了 一 部 电影 (或 者 一 部 也 没 看 ) ， 这 些 关 系 不 应 该 包含 在 内 。 


问题 涉及 在 聚合 阅 数 上 的 过 滤 。 在 SQL 中 ， 在 聚合 消 数 上 过 滤 是 由 HAVING 语 句 完成 的 ,但 是 Cypher 并 不 支持 这 个 。 而 在 
Cypher 中 可 以 使 用 with， 残 像 下 面 的 程序 演示 的 一 样 。 


with 语 名 管道 输送 计数 


不 有 是 撤回 聚 总 计 籽 ”而 是 姜 
| a | 束 。 3 1 au 二 
start n=nodel(ll) 2 车 


match n= [relj]=|) 用 
with TYPE'rel) as type, count (*) as count 


where count > 1 < 性 楼 太 一 个 where 语 名 
i sm ss 时 了 ey a E 0 上 可 
return typPe, COUnNtE.; 6 客 回 匹配 了 的 诞 输送 结果 


查询 从 起 始 节 点 以 索引 查找 开始 ， 然 后 匹配 所 有 与 之 相连 的 关系 。 但 是 ， 不 是 像 以 前 一 样 返回 聚合 的 结果 ， 而 是 用 with 语 
句 链接 它 (人 @@) 。 在 with 语句 中 ， 重 新 命名 输出 ， 这 个 输出 将 用 于 链接 命令 (type 和 count) 的 输入 。 链 接 以 后 ， 输 出 用 with 语 
句 定 义 为 新 的 where 语 句 的 输入 (@) 。 最 后 ， 返 回 匹配 的 结果 。 


全 注意 
在 被 用 作 链 接 查 询 之 前 命名 with 语 句 中 的 输出 字段 是 强制 性 的 。 
如 果 Cypher 的 这 个 功能 进化 得 非常 快 ， 你 是 否 必须 在 每 次 升级 到 下 一 个 Neo4j 版 本 时 重新 编写 Cypher 查 询 代码 ? 下 一 步 我 


们 将 讨论 如 何 处 理 不 同 版 本 的 Cypher 句 法 。 


6.4.4 ”Cypher 的 兼容 性 

我 们 已 经 提 到 Cypher 是 一 种 发 展 非常 快 的 语言 ， 它 的 句法 经 常 发 生变 化 。 为 了 给 Cypher 添 加 有 价值 的 新 功能 ， 开 发 者 有 时 
需要 引入 重大 的 更 改 ， 这 将 使 得 在 早期 版 本 的 Neo4j 中 写 的 查询 在 新 版 本 的 Neo4j 数 据 库 中 运行 失败 。 

幸运 的 是 ， 有 一 个 简单 的 设置 可 以 让 你 在 任意 版 本 的 Neo4j Cypher 引 警 上 运行 查询 。 即 可 以 在 运行 查询 之 前 指定 查询 句法 


符合 的 Neo4j 版 本 。 


CYPHER 1.8 start n=node (1) 
a i =" = vhs TT i he | ps ls | E 
match n- [rell-t) 在 查询 开始 之 前 指定 确切 的 


wi 十 [rel}) ags 七 snit (| S QOUIl : he i We 
Witn TiFEIreL) as type, Count(*) ags Count 中 Cypher 分 析 占 版 本 


where Count >» 1 
return type, CoOunt.; 


可 以 在 查询 的 开始 ， 在 start 语 句 之 前 (@) 使 用 CYPHER 关 键 词 跟着 Neo4j 版 本 指定 需要 的 Neo4j 版 本 。 
全 注意 
本 章 的 这 个 Cypher 例 子 已 经 在 Neo4j 2.0 版 本 通过 测试 。 


除了 在 所 有 的 查询 中 使 用 Cypher 分 析 器 版 本 外 ， 还 可 以 设置 全 局 配置 选项 cypher parser version。 这 个 选项 在 neo4j 的 属 


性 文件 里 设置 。 关 于 这 个 文件 在 服务 器 模式 和 内 入 式 模 式 下 的 位 置 ， 请 参阅 第 10 草 ， 我 们 将 在 第 10 草 对 论 不 同 的 配置 选项 。 


6.5 ”本章 小 结 


我 们 现在 已 经 了 解 了 Neo4j 的 查询 语言 Cypher， 知 道 如 何在 图 形 数 据 库 中 执行 Cypher 查 询 ， 如 何 编 写 高 效 的 Cyphet 查 询 从 图 形 
数据 库 中 提取 数据 ， 如 何 使 编写 出 的 Cypher 简 单 可 读 且 没有 损失 大 多 的 性 能 。 图 形 数 据 库 的 处 理 特 性 也 使 得 Cyphet 更 加 有 助 于 所 
有 的 维护 Neo4j 的 工作 。 


在 下 一 章 中 ， 我 们 将 深入 研究 Neo4j 的 事务 。 


第 / 章 事务 


本 草包 括 以 下 内 容 : 
` 为 什么 事务 是 重要 的 
* Neo4j 如 何 处 理事 务 
* Neo4j 如 何 与 其 他 事务 管理 系统 集成 
“ 如 何 利用 事务 事件 的 优点 


Neo4j 与 其 他 一 些 没有 结构 化 查询 (NoSQL) 反 术 的 不 同 点 在 于 ，Neo4 是 ACID 完全 兼容 的 (ACID 是 Atomic、 
Consistent、1solated、Durable 的 首 字母 缩写 一 一 原子 的 、 一 致 的 、 隔 离 的 、 持 续 的 ) 。ACID 完 全 兼容 意味 着 Neo4j 与 使 用 传 
统 的 关系 数据 库 一 样 有 保证 。 


当 使 用 Neo4j 时 ， 上 有 具有 ACID 保证 是 很 重要 的 ， 因 为 对 图 形 数据 库 在 同一 个 事务 中 进行 大 量 的 实体 (节操 、 关 系 和 索引 实 
体 ) 进行 变更 操作 是 很 普遍 的 。 也 很 容易 对 系统 完全 兼容 ACID 的 系统 行为 做 出 推理 ， 完 全 兼容 ACID 是 相对 于 最 终 一 致 系统 而 
言 ， 在 最 终 一 致 系统 里 并 没有 实际 担保 在 什么 时 间 数 据 的 改变 能 在 一 连 串 的 操作 中 可 见 ， 相 对 技术 来 讽 ， 那 里 没有 事务 ， 因 此 ， 
一 个 大 的 商务 操作 的 部 分 结果 可 能 会 暂时 可 见 以 与 事务 竞争 。ACID 事 务 在 可 持续 性 方面 也 提供 了 高 自信 和 度 ， 一 旦 事务 提交 ， 数 
据 残 不 会 丢失 。 


本 书 的 其 他 章节 中 也 提 及 事务 ， 本 章 将 对 事务 做 比较 详细 的 探讨 。 


7.1 事务 的 基础 知识 


首先 ， 让 我 们 考察 一 下 在 Neo4 中 创建 事务 的 方法 ， 如 下 面 的 程序 所 示 : 


try (Transaction tx = graphDatabaseService.beginTx()) 1 
/7 用 数据 库 做 一 些 事情 
上 其 Successl); 


这 段 代码 开头 使 用 Java 7 的 try-with-resource 语 句 ， 创 建 一 个 新 的 事务 并 定义 一 个 本 事务 将 会 使 用 的 代码 块 。 任 何 与 数据 
库 交 互 和 在 块 内 执行 的 语句 将 会 在 同一 个 事务 中 运行 。 在 try 块 的 末尾 对 Success 方法 的 调用 表示 当 一 个 事务 结束 时 (或 在 try- 
with-resource 术 语 中 资源 关闭 时 ) 应 该 有 一 个 提交 。 当 代码 块 结束 (或 关闭 ) 时 事务 完成 。 然 后 ，Neo4j 会 确保 这 个 事务 的 提 
交 (已 经 探测 到 前 面 调用 了 success 方 法 ) 。 如 果 在 对 数据 库 做 操作 时 出 现 意外 的 情况 ， 将 不 调用 Success 方法 ， 当 事务 结束 时 将 
回 滚 到 原来 的 状态 。Neo4j 涉 及 是 否 提交 或 回 滚 的 决策 逻辑 基于 前 面 是 否 调用 了 success 或 failure 方 法 。 如 果 想 显 式 地 回 滚 一 个 
事务 ， 例 如 从 一 个 条 件 代码 块 ， 可 以 调用 failure 方 法 ， 则 事务 将 在 程序 块 的 结束 做 无 条 件 的 回 滚 。 既 不 调用 Success 方法 也 不 调 
用 failure 方 法 也 将 会 导致 事务 回 滚 (默认 ) 。 

Neo4j 2.0 以 前 的 事务 
在 老 版 本 的 Neo4j (1.9 和 以 前 ) 中 ， 管 理事 务 有 一 点 复杂 ， 主 要 是 因为 在 Java7 以 前 没有 自动 关闭 资源 功能 ，Neo4j 从 2.0 版 本 


开始 具有 了 该 功能 。 
如 果 使 用 老 版 本 的 Neo4j ， 处 理事 务 的 方法 如 下 : 


Transaction tx = graphDatabaseService.beginTxl().:; 
try 1 

/do something 

tx BUCCEBS(); 
| finally | 

tx finish(); 


这 种 风格 是 可 行 的 ， 但 是 在 Neo4j 2.0 中 不 赞成 这 样 使 用 。 


在 Neo4j 2.0 中 ， 包 括 世 点、 关系 、 模 式 和 这 引 的 图 形 对 象 ， 任 何 的 读 或 写 操 作 都 需要 激活 一 个 事务 。 注 意 在 先前 的 版 本 
中 ， 并 没有 对 读 操作 提出 这 种 要 求 。 


程序 7-1 给 出 了 首先 读 一 个 代表 人 的 节点 ， 然 后 设置 一 个 年 龄 属性 。 


【程序 7-1】 ”没有 事务 的 尝试 更 新 


Node userNode = graphDatabaseService.index!) 要 查找 起 始 节 点 ， 在 
.forNodes ("byName'") .get ("name", "John") .getSsinglel(). I 
he lm ee ph ee ed Neo 和 20 中 将 会 
usSerNode. setPropertyl"age", 34); 可 济 有 此 开始 一 小事 各 而 设置 一 涉 生 损 
用 刻 的 年 论 


四 注意 


本 章 的 例子 故意 假设 了 一 组 非常 简单 的 数据 模型 ， 仅 仅 由 2 个 节点 组 成 ，John 和 Bob， 代 表 设 置 了 年 龄 属性 的 两 个 人 。 这 个 数 


据 模 型 足以 演示 Neo4j 的 事务 行为 。 


三 | 


当 以 Neo4j 2.0 以 前 的 版 本 运行 这 段 代码 时 ， 行 将 通过 ,但 是 行人 @@ 将 会 导致 一 个 NotinTransactionException 异 常 。 这 是 
因为 在 Neo4j 1.X 版 本 中 的 变更 操作 需要 一 个 事务 ， 而 只 读 操作 没有 事务 。 而 在 Neo4j 2.0 及 其 以 后 的 版 本 中 ， 人 @Q 和 人 @ 都 会 失 
败 ， 抛 出 NotinTransactionException 异 常 。 


7.1.1 添加 事务 
程序 7-2 来 目 程序 7-1， 但 是 加 入 了 事务 管理 。 本 章 的 后 面 ， 我 们 将 假设 具有 事务 的 风格 以 满足 Neo4j 2.0 的 需求 。 


【程序 7-2】 具有 事务 的 更 新 


trvy(lTransaction tx = graphDatabaseService,beginTx(}) | o 可 
Node userNode = grachDatabaseService.indexl) | 开始 刘 委 
.forNodes ("DyName') .get ("namer, John") .getsingle(); 
userNode .setProperty ("age", 34) ~ 
tx, SUCCeges(); | 设置 用 户 的 年 具 
} 标志 事务 成 功 


这 段 程序 代表 了 开始 一 个 事务 的 通 剃 模式， 执行 一 些 操作 ， 并 假设 没有 异 弟 地 完成 。 在 调用 success 万 法 之 后 代码 块 完成 ， 
数据 的 变化 提交 到 | 数据 库 中 。 
基于 模式 的 操作 和 事务 


如 果 在 图 形 数 据 库 中 做 任意 与 模式 相关 的 操作 ， 这 些 代码 需要 在 与 所 有 其 他 Neo4 事 务 代码 相隔 离 的 一 个 事务 中 ， 否 则 ， 将 
抛 出 ConsttaintViolationException 异 常 并 提出 如 下 信息 : “在 做 模式 更 新 的 事务 中 不 能 做 数据 更 新 。 


在 第 5 章 中 讨论 了 模式 索引 ， 下 面 的 代码 是 程序 5-5 的 一 部 分 用 以 演示 现在 的 情况 。 扼 要 重 述 一 下 ， 在 一 个 事务 中 定义 USER 
标签 的 hname 作 为 模式 可 索引 的 属性 ， 然 后 使 用 分 离 的 事务 实际 设置 一 个 真实 用 户 的 值 。 


Label userLabel = DynamicLabel. label ("USER") ; 


/i 11. Do schema related work in one transaction. 
try (Transaction tx = graphDb .beginTx()) 1 

qraphDb. schemal) .indexFor (userLabel) .on("'name'") .createll), 
七 其 SUCCEeSsSs(); 


| 


六 2. Do other work in a separate transaction. 


Node User = 了 ULL; 
try (Transaction tx = graphDb.beginTx()} 1 
UBEer = graphDp.createNode (userLabel).; 


User. SetProperty("name", "Michael Collins"}.; 
Lx, SUCcess (让 ) 


| 


7.1.2 打 好 基础 ,循序 渐进 


在 try 块 中 创建 一 个 事务 ， 残 像 我 们 表面 所 说 的 一 样 ， 确 保 事务 在 适当 时 间 完 成 。 事 务 的 状态 特性 需要 对 在 一 个 事务 中 完成 
的 工作 量 给 予 考虑 。 这 仅仅 针对 大 的 事务 ， 包 括 大量 的 插入 和 更 新 数据 ， 如 程序 7-3 所 示 。 当 执行 这 段 代 码 时 ， 很 可 能 以 出 现 内 


仔 不 够 的 异常 而 终止 ， 具体 取 决 于 Java 虚 拟 机 (JVM) 的 可 用 内 存 。 
【程序 /7-3】 一 个 大 事务 可 能 出 现 内 存 不 够 用 的 情况 


trvlTransaction tx = graphDatabaseService.beginTx()}) | 
for (int i = 0; i < 100000000; i++) ‘1 
Node n = this.graphDatabaseService.createNode').,; 


下 时 


n.setProperty ("number", 1); 


Java. 1ang.OutofMemoryError: Java heap space 


at Java.util] .HashMap.addEntry (HashMap .Java: T7766] 

at Java.util.HashMap.put (HashMap .Java:402) 

at Java.util,Hashset .add lHashset .ava:217) 

at org.neod4] .kernel .impl .api.Diffsets.addiDiffsets.ava:ssd) 
at 


为 了 避免 在 大 的 事务 中 出 现 内 存 不 够 的 异常 ， 应 该 将 大 的 事务 分 成 几 个 小 的 事务 。 然 而 ,一般 情况 下 不 推荐 对 每 一 个 新 的 节 
点 使 用 分 离 的 事务 创建 大 量 证 点 ， 这 是 因为 事务 的 计算 消耗 将 会 对 性 能 产生 很 大 的 影响 。 更 好 的 策略 是 在 一 个 事务 中 批 处 理 成 百 
也 诗 上 干 个 创建 操作 。 确 切 的 数量 依赖 于 创建 每 一 个 节点 所 涉及 的 数据 量 。 


前 面 的 例子 中 混合 了 服务 器 端 和 客 尸 端的 行为 ， 因 为 使 用 的 是 骨 入 式 模 式 。 在 一 个 更 传统 的 客 尸 端 /服务 器 情形 下 ， 人 处 理 大 
事务 的 压力 主要 影响 到 服务 器 ， 因 为 服务 器 需要 保留 大 量 的 潜在 用 户 还 没有 提交 的 事务 。 
批 处 理 插入 和 事务 


对 Neo4j 提 供 批 处 理 播 入 功能 以 快速 批 处 理 插入 没有 任何 意义 。 然 而 ， 这 个 类 是 为 了 速度 而 优化 ， 并 不 支持 事务 ， 而 不 是 像 
它 应 该 做 的 那样 把 数据 的 变化 写 到 磁盘 上 。 这 样 的 功能 在 下 面 的 情况 下 可 能 很 有 用 ， 即 有 大 数据 集 需 要 一 次 加 载 ， 但 是 需要 充分 
注意 使 用 该 功能 的 影响 。 更 多 的 信息 请 参阅 Neo4j 手 册 http://docs.neo4j.org/chunked/stable/batchinsett.html。 


在 本 忆 中 ， 我 们 已 经 看 到 了 当 程 序 需要 与 图 形 数据 库 交互 时 程序 如 何 管 理事 务 。 这 使 我 们 有 充分 的 信心 来 定义 工作 原子 单 
位 ， 成 功 地 完成 意味 着 数据 变化 的 永久 性 和 图 形 数据 库 始 终 保持 一 致 性 。 在 下 一 节 中 ， 我 们 将 稍微 深入 地 探讨 一 下 事务 ， 包 括 如 
何 使 用 锁 作为 一 种 控制 隔离 级 的 读 事 务 的 方法 。 尽 管 这 不 是 必须 的 ， 但 在 某 些 情况 下 有 可 能 要 做 的 。 


世人 套 的 事务 


Neo 作 支持 平面 谋 大 事务 ， 这 意味 着 吝 套 事务 是 可 能 的 ， 但 是 内 外 事务 最 终 将 共享 相同 的 环境 。 如 果 所 有 的 事务 都 调用 
success 方 法， 那么 它们 的 所 有 修改 都 将 提交 给 数据 库 。 


如 果 要 从 内 事务 显 式 地 提示 操作 的 失败 ， 可 以 调用 failure 方 法 ， 这 将 标志 整个 事务 的 失败 。 在 这 种 情况 下 ， 事 务 将 会 回 滚 并 


且 将 会 在 最 外 层 事务 的 结束 时 抛 出 TransactionFailufeException 异 第 。 


7.2 事务 的 高 级 功能 


我 们 已 经 讨论 了 Neo4j 中 事务 的 基本 工作 情况 ， 这 已 经 给 予 了 足够 的 知识 处 理 大 多 数 情况 下 的 事务 需求 。 但 是 ， 如 果 需 要 获 


得 比 默认 的 隅 离 级 更 遍 的 隅 离 保证 ， 或 者 要 编写 健壮 的 程序 代码 而 不 出 现 死 锁 ， 那 惑 需 要 理解 Neo4j 的 事务 管理 模型 。 


我 们 将 通过 考察 事务 如 何 工 作 和 Neo4j 提 供 的 默认 隅 离 级 开始 。 然 后 我 们 将 看 一 看 使 用 显 式 的 锁 获 得 更 强 的 隅 离 保证 。 


7.2.1 事务 的 语义 


让 我 们 考察 一 些 ACID 事 务 提供 的 保证 和 它们 在 Neo4 中 是 如 何 和 理 的 。 
事务 和 线程 的 局 域 性 
Neo4j 中 的 每 一 个 新 事务 都 绑 定 到 当前 的 线程 上 。 因 为 这 个 原因 ， 保 证 每 一 个 事务 都 适当 的 结束 和 每 一 个 事务 的 内 容 恰 当 清 
晰 非常 重要 。 和 否则 ， 运 行 在 同一 线程 的 下 一 个 事务 很 可 能 受到 上 一 个 事务 的 影响 ， 导 致 错误 的 结果 和 不 一 致 的 输出 结果 。 本 章 提 


供 的 代码 将 会 帮助 你 避免 这 类 问题 。 

永久 性 

永久 性 是 指 把 数据 永久 写 入 到 | 数据库 中 ， 以 便 在 数据 库 重 局 时 数据 仍 存 在 。 如 果 一 个 事务 成 功 ， 可 以 认为 数据 已 经 永久 保存 
到 了 硬盘 。 


尽管 Neo4j 在 内 部 保留 了 一 个 事务 的 日 志 以 记录 更 新 和 保留 每 一 个 成 功 的 改变 操作 事务 ， 当 达到 有 某 一 个 程 大 时 ， 或 者 当 数 气 
库 关闭 时 ， 事 务 日 志 将 变 得 繁忙 起 来 并 且 硬 盘 上 的 适当 储存 文件 将 被 更 新 。 第 11 章 将 讨论 事务 日 志 的 作用 |。 


隅 离 级 别 与 Neo4j 锁 


许多 数据 库 管 理 系 统 使 用 锁 机 制 来 管理 对 同一 个 数据 库 的 同时 访问 。Neo4j 事 务 是 由 清晰 的 读 锁 和 写 锁 来 控制 每 一 个 图 形 数 
据 库 资源 (节操 和 关系 ) 。 


读 锁 是 很 有 用 的 ， 因 为 读 锁 可 以 保证 相关 资源 一 致 性 的 锁定 ， 当 在 读数 据 时 不 会 友 生 意外 的 修改 数据 。 更 精确 地 说 ， 如 果 没 
有 写 锁 在 同一 个 数据 库 中 激活 ， 则 读 锁 可 以 在 任何 的 图 形 资 源 上 随 晶 地 获得 。 多 个 读 锁 之 间 并 不 相互 排斥 ， 在 同一 时 间 的 多 续 程 
中 ， 可 以 在 同一 数据 资源 中 获得 多 个 读 锁 。 在 给 定 的 时 刻 ， 对 同一 数据 资源 只 能 获得 一 个 写 锁 ， 还 必须 没有 其 他 激活 的 锁 ， 不 管 
是 读 锁 还 是 写 锁 。 读 锁 和 写 锁 之 间 的 区 别 以 及 它们 的 交互 方式 使 得 开 友 者 能 灵活 地 权衡 性 能 的 一 致 性 ， 具 体 取 决 于 对 正在 处 理 的 
情况 什么 是 可 以 接受 的 。 


Neo4j 事 务 的 默认 设置 并 不 目 动 获取 读 锁 。 因 此 ， 读 的 数据 是 节点 、 天 系 、 索 引 实体 最 新 提交 的 状态 ， 除 非 在 它 目 己 的 事务 
中 ， 局 域 的 修改 (即使 没 提交 ) 是 可 见 的。 图 7-1 给 出 了 一 个 演示 这 种 情况 的 例子 。 


* 直上 
法 担 磷 


1.A 


线程 A (只 起) 


trytTransaction tx db .beginTxt)) 


Node Johnl 
graphDB .getNodeById {2z) 


lIog(IcShnl .getPropertyl"age"™y); 


Node johnz 
graphDB .getNodeById tz) 4.A 


iopg (john2 .getProperty ("age"™)}):; 


Node john3 = 
graphDB .getNodeBylId 2) 6.A 
lIogtIohn3.getPropertyl"age™}):; 


七 束 Bl 号 了 避 忆 全 号 总 I he 十 


-| 


和 上 2 和 开 记 孙 了 John 的 年 种 


1A 线程 A 加 载 
2.B 组 程 B 加 载 了 


线程 BI 周 用 了 setProperty，Neo4j 笛 要 
的 局 域 副 本 的 年 龄 为 35 


线程 A 仅仅 是 记 


re 


亲 名 2 并] 对 


『Jobhn 的 } 征 


它 井 不 5 献 队 1) 使 用 


对 这 个 措 定 的 斑点 


ld: 2 
Name: John 
和 ge: 34 


F 


线程 B CH: 各 ) 


Transaction tx JraphDB .beginTrx(); 


trytTransaction tx db.beginTx()) 


上 


Node John 
liog (john.getProperty("age™))}); 


JraphDB .getNodeById (2)} 


DB 


john.setProperty ("age™, 33) 


蒜 下 二 和 说 屋 | 


| 


(在 这 个 时 间 点 专 


E44 1 


团 ( 在 这 个 时 间 点 是 34 ) 


个 写 帘 ， 开 且 轴 狐 线 柱 内 入眠 


或 介意 有 没有 什么 锁 ， 因 此 只 和 闸 单 地 加 载 节 点 2 并 


i 记录 John 的 年 龄 (在 这 个 时 间 点 上 仍然 是 半 ， 由 于 线程 B 还 没有 提 眉 ) 
线程 日 完成 了 事务 ， 数 据 的 变化 已 提 构 ， 节 点 的 写 铺 已 释放 


线程 A 加 载 闻 点 2 并 记录 Jobhn 的 年 龄 (现在 是 35 去 最 后 提交 的 数值 ) 
图 7-1 默认 隔离 级 


写 锁 则 是 在 对 任意 图 形 资 源 试图 做 变 
有 的 锁 。 


这 个 默认 行为 与 天 系数 据 库 中 的 读 提交 隔离 
的 友 生 。 


哪个 图 形 资 源 被 锁定 和 什么 


更 操作 时 目 动 获得 ， 人 在 事务 的 持续 时 间 内 都 有 效 。 


时 候 锁 ? 当 试 图 修改 一 个 图 形 对 象 时 ( 即 当 创建 、 删 除 或 者 更 新 一 个 节点 


每 一 个 事务 确保 在 完成 时 目 动 释放 所 


级 别 非常 相似 ， 隔 离 级 别 除 去 了 潜在 的 脏 读 ， 但 是 仍然 允许 幻像 读 和 不 可 重复 读 


锁 的 到 底 是 什么 ? 


或 关系 的 属性 


时 ) ，Neo4j 必 须 获取 一 个 在 问题 中 对 人 象 的 写 锁 以 保护 同时 发 生 修改 。 同 样 ， 当 创建 两 个 已 存在 的 节点 之 间 的 一 个 新 关系 时 ， 两 


个 节点 由 事务 锁定 


oO 


` 朽 田 


人 像 


1 == 


不 可 重复 读 是 指 在 数据 库 访 问 中 ， 


读 是 捐 一 个 事务 有 可 能 在 不 同 的 时 间 读 a 到 不 同 的 书 


点 和 天 系数 的 情况 ， 原 因 是 另 一 个 事务 在 相同 的 时 间 添 加 或 删除 了 一 


一 个 事务 学 围 内 两 个 相同 的 查询 却 返 回 了 不 同 数据 ， 即 原始 读 取 不 可 重复 


图 7-1 是 Neo4j 的 默认 隅 离 级 。 在 图 中 ， 两 个 线程 竞争 访问 同一 个 图 形 资 源 ， 导 致 了 一 个 读 提交 隅 离 级 。 
通过 显 陈 管理 锁 ， 有 可 能 获得 更 高 的 事务 保证 ， 正 像 下 一 节 将 会 看 到 的 那样 。 
高 可 用 模式 下 的 事务 


本 章 讲 述 的 事务 行为 的 重点 主要 放 在 单一 的 Neo4j 实 例 内 将 发 生 什 么 。 在 高 可 用 (HA) 模式 中 ， 有 两 类 Neo4j 实 例 ， 主 的 和 
副 的 ， 并 且 事 务 确保 写 操作 总 是 一 致 和 永久 的 。 尽 管 技 术 上 能 够 做 到 对 任意 的 Neo4j 实例 做 写 操作 ， 写 操作 首先 推 给 主机 并 且 最 
终 传递 给 副 机 。 这 个 行为 是 自动 的 并 且 可 以 进行 设置 以 获得 持续 性 和 性 能 之 间 的 一 些 权 衡 。 关 于 更 多 的 Neo4j 高 可 用 模式 和 在 实 
际 中 的 应 用 可 以 阅读 第 11 章 。 


7.2.2 ”事务 中 的 读 取 与 显 式 读 锁 


正如 前 面 所 看 到 的 ， 从 图 形 数 据 库 中 读 值 返回 的 是 最 新 提交 的 值 (或 当前 修改 的 状态 ) ， 这 与 读 提交 隅 离 级 (Read 


Committed isolation level) 是 等 效 的 。 程 序 7-4 给 出 了 读 一 个 节点 属性 两 次 的 一 些 代码 (在 这 种 情况 下 是 用 户 的 年 龄 ) 作为 商 
业 操 作 的 部 分 ， 在 读 之 间 做 一 些 额外 的 读 。 


【程序 7-4】 ”在 不 用 事务 的 情况 下 读 同 样 的 属性 两 次 


try (Transaction tx = graphDatabaseService.beginTx{()) | 
Node n = graphDatabaseService.lndexl(). 
forNodes ("byName") ,get ("name", "John") .getSinglel)., 

从 用户 节 点 ”» int adge = (Integer) ni.getProperty("agqe'").:; 做 讲 一 步 
里， 民 故 和 一 rp 
读 年 齿 /do a different operation < 一 | 

人 int secondAge = lInteger) n.dgetProperty ("age').; ; 处 得 
再 次 读 年 具 ， 但 是 
it (lage 1 = Secondhge) 1 
人 je wy 和 在 的 访 到 更 新 和 
throw new RuntimeException'i"surely some mistake")., 


| 年 瞧 
tx.sSuccegst().;: 


由 于 其 他 处 理 的 时 间 不 确定 ， 这 里 将 会 有 一 个 做 外 部 修改 的 重要 的 窗口 出 现 。 如 果 程 序 混合 着 许多 读 和 写 ， 这 可 能 成 为 一 个 
问题 。 


如 果 需 要 一 个 更 局 级 别 的 隅 离 级 以 确保 其 他 人 不 能 修改 正在 读 的 图 形 资 源 ，Neo4 提 供 了 一 个 潜在 的 显 式 获取 对 图 形 资 源 的 
读 锁 。 程 序 7-5 给 出 了 相应 代码 ， 但 是 这 一 次 在 读 取 任 何 的 属性 之 前 有 一 个 额外 的 显 式 请 求 获取 对 节点 的 读 锁 。 


【程序 1-5】 ”在 增高 隔离 级 的 情况 下 读 同样 的 东西 两 次 


Node n = this.graphDatabaseService.1index!) 
.forNodes ("byName") .get ("name"™, "John") .getSingle'!), 
/:/ acgquire a read lock on n. The lock will be released automatically 
/:/: when the transaction completes 


tx.acaqulreReadLock (n).:; Ea 
int age = (Integer) n.getPropertyl"age"):; 对 节点 请 求 一 个 证 销 


/:/do somethindg else 


try(Transaction tx = graphDatabaseService.beginTx())} | 
| 开始 一 个 事务 


int secondAge = (Integer) n.getPFropertyl"age"), 


if (lage != secondaAge) | 
throw new RuntimeException("should now never happen").: 
| 


j 
tx. succesgs().; 


图 7-2 展 示 了 如 何 使 用 读 锁 获 得 更 高 的 隔离 级 。 

当 读 数据 时 ， 有 两 个 很 好 的 理由 避免 使 用 系统 的 锁 。 束 像 以 前 提 及 的 ， 首 先 这 将 产生 事务 的 状态 ， 并 且 很 占 内 存 。 第 二 ， 这 
里 主要 的 权衡 是 同时 写 数 据 ， 因 为 线程 希望 更 新 任何 有 显 式 读 锁 的 书 点 或 关系， 在 锁 被 释放 或 事务 完成 前 是 锁定 的 。 
7.2.3 ”事务 中 的 写 入 与 显 式 写 锁 


正如 以 前 讨论 的 ， 当 要 修改 每 一 个 资源 时 ， 当 前 的 事务 会 目 动 为 你 获取 一 个 不 同 于 其 他 的 写 锁 。 然 而 ， 这 些 锁 并 不 是 必须 同 
时 有 的 。 可 能 会 有 你 的 业务 逻辑 需要 以 一 致 的 方式 修改 一 个 节操 或 关系 集 的 情况 ， 并 且 要 确保 没有 其 他 事务 能 够 同时 修改 它们 。 
如 果 你 的 应 用 程序 需要 这 样 高 的 事务 隔离 级 (这 很 像 关 系数 据 库 中 的 可 捉 行 化 的 (Serializable) 隔离 级 ) ， 可 以 在 修改 数据 之 
前 ， 在 事务 的 开始 对 一 个 图 形 资源 集 获 取 显 陈 的 写 锁 。 通 单 ， 当 事务 完成 后 这 些 锁 将 会 目 动 释放 。 


显 式 计 锯 癌 艾 


线 柱 和 【上 


trvtTransaction tx = Dh .beginTx(}} 


Node johnl] = 

orachDB .oetNodeById lz2} 
tx ,acquireReadLock (johml}: 1, 
lootijohnl .getProperty ("age™)); 


i Does SomEe tit 


Node john2 = : 
graphDB .gethNodeBy1d (2} 半 . 筷 
logtijohn2 .getPhroperty ("aoe™}}; 


tI): 
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浇 枉 向 载 了 下 扣 2 开 显 式 请 求 一 小 谈 宕 ， 


国 ] 经 和 Bf 公公 古寺 ,不管 有 什么 镇 (时 认 情况 下 ) 
的 年 龄 { 在 这 全 时 间 点 仍然 基 守 

二 竹 日 疝 用 三 Se 让 roperty ，NEod 计 宕 出 到 这 小 
碧 到 能 澡 吐 取 一 个 写 锁 时 才能 读数 据 


法 和 三 丰 未 江 


二 和 下 完成 了 事 芳 ， 时 其 全 和 料 厂 所 有 的 拓 ， 


人 


志和 相 B 提 莹 偿 此 并 苦头 与 锁 于 成事 秀 


人 全 显 的 局 域 员 本 入 记录 Johmb 的 年 直 


线程 百 解 除了 阻止 并 可 以 切取 目 己 的 关于 节点 的 写 


许 尚 单 地 加 孔 让 点 2 记 


让 点 到 经 存在 


个 读 锁 ， 


ee em em em 5 ee ee ee me mm em ee ee ee em mm em em ee ee mn En 5 


线程 BT S 写 些 程 ) 
tryv (Transaction tx = Gb.beginTrx hh 1 


Node john = graphhB .getNodeByidi2}:; 
laogtijohn .getProperty "age"ll:; 


| 
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jahr :set Property tl" age", 425) 


证 


站 


4 


电 录 John 上 fi 定 龄 (1 和 在 这 小 时 间 点 古 弹 


john 


证 目 丰 区 证 焉 才气 ， 


在 这 个 时 | 间 点 上 人 情 然 大 和) 
因 括 显 式 请 求 的 壕 秆 


鳞 ， 并 且 更 新 它 的 John 年 龄 局 域 剧 本 到 35 


图 7-2” 显 式 读 锁 


在 程序 7-6 中 ， 两 个 忆 


【程序 7-6】 显 式 获 取 写 锁 


(Transaction tx = 
Index<Nodes nodeIndex = 
Node nl = nodeIndex .get ("name"™, 
Node rn2 = nodeIndex.get "name"™, 
tx.acouireWriteLock (nl1):; 
tx.acoquireWriteLock (n2); 


try 


graphDatabaseService.beginTx{)) | 
graphDatabaseService,.1index!). 


拟 显 式 地 获取 了 写 锁 以 确保 它们 以 可 捉 行 化 的 万 式 共同 更 新 。 


forNodes ("byName").; 


njJohn'"') .getsingle'().:; 


记 Bob 是 ) 


.getsingler().; 


nl.setProperty("age", 35).; 
n2.getProperty(l"age", 37) ; 


tx SUcoess(); 


再 一 次 提醒 ， 在 运行 程序 时 必须 非常 注意 权衡 一 致 性 与 性 能 和 资源 的 耗费 。 
7.2.4 无 效 锁 的 危害 


尽管 前 面 讨 论 的 锁定 扩 术 允许 灵活 地 管理 隔离 级 ， 但 是 不 可 避免 地 引进 了 产生 无 效 锁 的 可 能 性 。 无 效 锁 可 能 在 两 个 或 多 个 事 
务 对 同一 个 图 形 人 资源 莞 争 获取 锁 的 时 候 出 现 。 如 果 事 务 A 试 图 按 节 点 1 和 节点 2 的 顺序 锁定 它们 ， 而 事务 B 试 图 对 相同 的 节操 按 相 
反 的 顺序 获取 氏 ， 那 么 每 一 个 事务 可 能 会 锁定 一 个 节点 并 且 无 限期 地 等 待 男 一 个 节 点 释放 ， 从 而 产生 一 个 无 效 锁 。 


当 无 效 锁 友 生 的 时 候 ，Neo4j 具 有 一 个 内 置 的 机 制 对 其 进行 探测 ， 大 有 ， 则 抛 出 一 个 DeadlockDetectedException 异 音 并 
且 事 务 回 滚 。 当 锁定 是 由 Neo4 专 门 管理 时 ， 才 能 进行 无 效 锁 的 探测 ， 这 意味 着 通过 依赖 于 Neo 笑 的 自动 默认 锁定 机 制 ， 或 者 仅 
仅 通 过 使 用 我 们 前 面 讨 论 过 的 Neo4j API 的 相关 锁定 万 法 (acquireReadLock 和 和 acquireWriteLock) 。 如 果 使 用 任何 其 他 的 氏 
定 机 制 ， 例 如 使 用 Java 的 同步 (synchronized) 关键 词 ， 即 使 友 生 无 效 锁 也 不 会 被 探测 出 ， 应 用 程序 很 有 可 能 出 现 终止 。 


要 有 效 处 理 无 效 锁 ， 有 几 件 简 单 的 事情 可 以 做 。 第 一 个 是 坚持 使 用 Neo4 提 供 的 核心 API 而 不 使 用 任何 外 部 的 锁定 机 制 。 这 
将 确保 Neo4j 的 无 效 锁 探 测 机 制 是 有 效 的 ， 确 保 你 的 应 用 程序 不 会 完全 锁 死 ， 并 且 数 据 会 保持 一 致 性 。 人 在 Neo4j 核 心 API 中 的 所 
有 操作 (除非 男 有 指定 ) 都 是 线程 安全 的 ， 因 此 ， 一 般 不 需要 外 部 的 同步 。 另 一 个 是 通过 确保 图 形 资源 能 够 以 同样 的 顺序 进行 访 
问 来 避免 无 效 锁 。 


我 们 现在 已 经 详细 地 讨论 了 Neo4j 的 事务 。 在 下 一 节 ， 我 们 将 把 重点 放 在 与 其 他 事务 管理 系统 集成 Neo4j 事 务 的 相关 问题 
上 。 


7.3 ”与 其 他 事务 官 理 系统 的 集成 
到 目前 为 止 ， 我 们 已 经 看 过 的 事务 处 理 代码 是 专门 用 于 Neo4j 的 核心 APl 来 开始 和 完成 事务 的 ， 并 没有 对 程序 运行 的 环境 的 
性 质 做 任何 的 假设 。 


如 果 你 是 在 建立 一 个 典型 的 企业 应 用 程序 ， 你 很 可 能 会 与 一 个 已 经 存在 的 事务 管理 器 集成 ， 例 如 一 个 应 用 程序 服务 器 提供 的 
呆 A 事 务 管理 器 。org.neo4j.kernel.impltransaction 程 序 包 包含 着 许多 类 支持 这 种 使 用 情况 。 


同样 的 ， 如 果 应 用 程序 是 建立 在 流行 的 Spring 框 架 上 的 ， 你 将 从 Spring 的 声明 事务 支持 受益 并 确保 代码 更 健壮 。 程 序 7-7 建 
了 一 个 Spring J 朵 A 事 务 管理 器 ， 与 Neo4j 的 TransactionManagersService 和 UserTransactionService 相 关联 。 


【程序 7-7】 设置 Spring 事务 管理 器 


必 后 蕊 吾 玫 日 六 


激活 <tx:annotation-driven transaction-manager="neo4jTransactionManager",> 
声明 <bean ld="pDretendService" class="org .neco4]1ia.tx.APretendService"S> 
事务 <property name="graphDatabaseService'" ref="graphDatabaseService'"/> 
</bean> 
设置 图 形 i <bean id="graphDatabaseService" 
i Class= "Org .neo4] .Kernel .EmeddedGeraphnDatabase'" destroy-method="shutdown" 
数据 库 的 scope="gingleton"> 
服务 <CONnstructor-arg value="target/spring-test'"/> 
</bean> 
<bean id="neo4jIransactionManagerService" 3 设置 Neo4j 
Class= "Org .ne04] .Kernel .impl.transaction "SpringIransact icnManager" > 过 甸 管理 器 
<CONnstructor-arg ref="graphDatabasedervice" /> 
< /heans 服务 和 用 户 
事务 服务 
<bean id="neo4jUserTransactionService" 1 
Class="Org .neodj .kernel.impl .transaction.UserTrangsactionImpl"> 
<Constructor-arg ref="graphDatabaseService'" /> 
</ bean> 
语 置 图 形 > <bean id="neod4]TransactionManager!" < 
数据 库 的 忆 二 书包 与 = 由 局 工 柯 .springframework ,transaction.ta.JtaTransactionManager's 
服毒 <property name="transactionManager" ref="neo4jTransactionManagerService" 
服 3 Ls 
<Pproperty name="uUsSerTransaction" ref="neo4jUserTransactionService" /» 
< /Deany> 
a 设置 一 个 标准 的 Spring JTA 事务 管理 器 和 添加 Neo4j 


TransactionManagerService 和 UserTransactionService 


这 种 设置 让 APretendService 组 件 能 够 以 Spring 的 @Transactional 注 释 法 注释 其 公共 方法 ， 以 避免 人 工 管理 事务 。 
程序 7-8 给 出 了 ApPretendsService 的 模样 ， 包 括 使 用 注释 声明 事务 管理 。 
【程序 7-8】 声明 事务 管理 


public class APretendService | 

private GraphDatabaseService gds; 

Tranasact1lional 

public Node createNodeVviaannotatedMethod(SsString name, int age) 1 
Node node = gds ,createNode()}); 
node. setProperty("name", name):} 
node .setProperty ("age", agde),; 
return node:; 

public void setGraphDatabaseServicelGraphDatabaseService gds) | 
this,.gds = gdg; 


你 已 经 看 到 了 如 何 将 Neo4 集 成 到 一 个 典型 的 Spring 应 用 中 。 对 一 个 更 面向 对 象 的 编程 模型 ， 第 9 章 将 讨论 Spring Data 
Neo4j,， 它 提供 了 一 个 在 域 类 和 Neo 和 之 间 的 映射 解决 方案 。 


下 一 步 ， 让 我 们 看 看 如 何 使 用 事务 事件 在 Neo4j 事 务 周围 添加 自 定义 逻辑 。 


7.4 ”事务 事件 


一 些 数据 库 实 施 引 及 目 定义 代码 数据 库 事务 的 执行 。Neo4j 具 有 事务 事件 管理 器 来 实现 这 个 功能 


bo 


TransactionEventHandler 接 口 包含 三 个 方法 : beforeCommit、afterCommit 和 afterRollback。 当 对 数据 库 进 行 实施 和 
注册 时 ， 它 们 将 会 在 每 一 个 事件 的 这 些 关 键 时 间 点 被 调用 。beforeCommit 方 法 可 以 有 选择 性 地 返回 一 个 对 象 ， 如 果 任 何 的 上 下 
连接 或 状态 需要 进行 交流 ， 这 个 对 象 能 被 传递 给 其 他 两 个 方法 。 


下 面 的 程序 给 出 了 GraphDatabaseService 对 象 创建 的 一 个 事务 事件 管理 器 的 骨架 。 


【程序 7-9】 ”事务 事件 管理 器 


gqraphDatabaseService,. regqlisterTransactionEventHandler (new 
TransactionEventHandler<Object>() 1 
Overrilide 
public Object beforeCommit (TransactionData data) throws Exception 1 
/i do some work 
:i no need to return 
return null. 


号 七 总 七 所 


ic void aftercCommit (TrarnsactionData data, Object state) 1 
/:/ do some work 

EOVverrlide 

PUublic void afterRollback (TransactiornData 


data, Object state) 1 
:i do some work 


}); 
a 


TransactionData 对 象 将 会 通知 你 事务 内 图 形 资 源 友 生 的 变化 。 事 件 管理 器 的 典型 使 用 情况 包括 对 外 部 系统 的 审查 和 集成 。 


例如 ， 你 可 以 设置 一 个 事件 在 每 一 个 新 用 户 添 加 到 系统 时 更 新 数据 板 。 


要 额外 留意 从 事务 事件 管理 器 运行 的 程序 代码 ， 尽 管 它 会 与 你 的 事务 在 同一 个 线程 运行 ， 不 及 时 运行 代码 将 会 对 系统 的 性 能 
生 影 响 。 从 事件 管理 器 出 现 的 异 单 也 会 导致 事务 的 失败 。 


事务 和 Neo4j 服 务 器 


本 章 的 重点 是 在 演示 误 入 式 Neo4j 设 置 事务 管理 的 使 用 。Neo4j 也 能 


够 以 服务 器 模式 运行 ， 这 种 情况 下 客户 端 用 户 是 通过 周密 
建立 的 基于 HTTP REST 的 API 访 问 Neo4j 服 务 器 的 ， 第 10 章 给 出 了 详细 的 有 关 这 种 模式 需要 做 的 事情 。 当 以 服务 器 模式 运行 时 


为 了 能 够 建立 健壮 的 、 性 能 优良 的 应 用 程序 ， 理 解 事务 的 管理 方式 和 对 其 考虑 是 很 重要 的 。 这 段 内 容 是 
时 应 当 注 意 的 与 事务 相关 的 一 些 关键 点 ， 


>» 


\ 


是 对 一 些 以 服务 器 模式 运 和 
而 没 给 出 详细 解释 。 请 阅读 10.4.3 节 获取 更 多 的 信息 。 
默认 情况 下 ， 每 一 个 对 Neo4j 服 务 器 的 请 求 都 是 通过 调用 REST API 实 现 的 ， 并 且 每 一 次 调用 都 是 在 其 自己 的 事务 内 实现 的 。 


通 

是 做 许多 细致 的 REST 调 用 很 有 可 能 对 你 的 应 用 程序 的 性 能 产生 负面 的 影响 。 除 了 通过 每 次 请 求 创建 的 新 事务 这 些 前 面 的 内 容 
外 ， 多 重 网 络 调用 本 身 就 是 一 个 对 性 能 影响 的 灾难 性 事情 。 为 了 帮助 解决 这 些 问题 中 的 菜 些 问题 ， 在 服务 器 模式 下 处 理事 务 场 景 
的 以 下 选项 应 给 予 考虑 。 


“ 使 用 REST Cypher 的 结束 点 一 提供 执行 单个 Cyphet 语 名 的 能 力 ， 这 可 能 导致 多 节点 或 关系 需要 更 新 。 所 有 影响 到 的 节点 
或 关系 将 会 作为 单个 HITP 请 求 的 一 部 分 进行 更 新 。 


“ 使 用 REST 事 务 结束 点 一 一 提供 在 一 个 事务 范围 内 执行 一 系列 Cypher 语 句 的 能 力 ， 但 是 不 像 Cyphet 的 结束 点 ， 而 是 通过 多 


个 HTTP 请 求 。 


` 使 用 REST 批 处 理 结束 点 一 一 提供 定义 一 项 工作 的 能 力 ， 当 发 送 至 批 处 理 REST 结 束 点 时 作为 单一 的 事务 执行 一 组 低层 的 


REST API 调 用 。 


“ 使 用 服务 器 插件 或 非 托管 的 扩展 一 一 提供 定义 Neo4j 服 务 器 运行 的 Java 编 码 能 力 ， 作 为 一 个 REST 调 用 的 结果 ， 提 供 完全 的 


程序 控制 (包括 事务 管理 ) 。 


一 -十 
7.5 本草 小 结 
事务 是 一 个 非常 复杂 的 主题 ， 期 望 你 到 目前 为 止 已 经 理解 了 Neo4j 如 何 充分 利用 基于 ACID 的 事务 管理 当前 对 图 形 资源 的 访 
问 。 


我 们 已 经 详细 讨论 了 事务 是 如 何 工作 的 : 默认 的 事务 行为 能 满足 大 部 分 情况 ， 但 是 我 们 考察 了 在 同一 时 间 对 同一 图 形 资 源 访 


问 的 事务 含义 ， 并 且 通 过 使 用 显 式 的 读 和 写 锁 能 够 获得 高 得 多 的 让 


企业 应 用 程序 经 常 建 立 在 像 Spring 这 样 的 框架 之 上 ， 我 们 讨论 了 如 何 利 用 Spring 的 声明 方法 将 Neo4j 事 务 集成 到 Spring 的 事务 管 


理 系 统 。 


最 后 ， 我 们 讨论 了 事务 事件 管理 器 ， 事 务 事件 管理 器 对 添加 自 定义 行为 到 事务 中 是 非常 有 用 的 ， 如 传统 关系 数据 库 的 激发 器 
(trigeet) 所 起 的 作用 。 


现在 你 已 经 知道 了 如 何 使 用 事务 ， 在 下 一 章 ， 我 们 将 教 你 更 多 的 关于 遍历 的 操作 ， 以 便 用 更 复杂 的 方式 查询 数据 。 


第 8 草 ”深度 遍历 


本 章 包 括 以 下 内 容 : 

: 遍历 的 顺序 如 何 影响 性 能 和 内 存 的 占用 

: 遍历 期 间 使 用 扩展 器 (expandet) 

使 用 uniqueness (唯一 性 ) 属性 控制 每 一 个 节点 的 访问 次 数 
使 用 双向 遍历 改进 图 形 查 询 的 性 能 


编写 有 效 的 刀 历 是 成 功 查 询 图 形 数据 的 关键。 在 第 4 草 中 我 们 学 习 了 Neo4 笑 声 历 API 的 基本 概念 。 本 草 将 深入 探讨 刀 历 API 的 
内 部 工作 原理 ， 因 此 ， 你 可 以 学 习 怎 样 以 最 有 效 的 方法 解决 最 复杂 的 图 形 问 题 。 


8.1 遍历 的 顺序 


每 一 次 遍历 器 访问 一 个 节点 ， 它 都 需要 决定 下 一 步 治 着 哪个 关系 访问 哪个 节点 ， 重 复 这 个 过 程 直至 遍历 结束 。 通 过 在 图 形 中 
选择 一 个 合适 的 路 径 ， 遍 历 可 以 很 快 结束 并 且 使 用 很 少 内 存 。 这 是 图 论 中 的 两 个 主要 顺序 算法 ， 并 且 这 两 个 算法 用 于 大 多 数 的 
Neo4j 人 遍历 中 : 深度 优先 (depth-first) 算法 和 广度 优先 (breadth-first) 算法 。 


要 了 解 志 历 的 效率 和 性 能 如 何 依赖 于 选 定 的 顺序 ， 请 看 图 8-1 的 图 形 。 


图 8-1 中 的 图 形 有 9 个 书 点 。 它 代表 一 个 树 状 图 ， 这 是 一 个 由 两 个 节点 通过 单个 路 径 相 连 的 图 形 类 型 。 换 句 话 训 ， 树 状 图 是 
一 个 没有 任何 环 的 图 形 。 为 了 使 我 们 演示 遍历 的 顺序 更 简单 ， 我 们 将 使 用 树 状 图 作为 一 个 例子 (对 一 个 具有 环 的 例子 ， 因 此 不 是 
树 状 图 ， 参 见 图 8-4) 。 
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| | 
图 8-1 具有 9 个 节点 和 8 个 关系 的 简单 图 形 


图 形 的 根 节 扣 标 记 为 1。 直 接 与 根 节 点 相连 的 (分支 ) 标记 为 2、3 和 4。 其 他 的 书后 ( 叶 ) 是 两 个 离开 根 节 扣 的 关系 ( 忆 氮 
2~9) 。 


让 我 们 看 看 按 深度 优先 和 广度 优先 的 顺序 遍历 这 个 图 形 的 区 别 。 我 们 的 目的 是 遍历 这 个 图 形 ， 因 此 能 够 访问 图 形 中 的 每 一 个 
三 点 正好 一 次 。 
8.1.1 ”深度 优先 


每 一 次 访问 一 个 节点 ， 需 要 决定 下 一 步 沿 着 哪个 关系 ,或 者 下 一 步 到 哪个 节点 。 深 度 优先 顺序 表明 你 应 该 首先 跳 到 现在 所 在 
且 以 前 没有 访问 过 的 节点 的 第 一 级 子 节 操 。 如 果 所 有 的 下 一 代 子 证 点 都 已 经 访问 过 ， 就 应 该 返回 具有 没有 访问 过 的 子 忆 点 的 第 一 
个 书 点 上 。 图 8-2 展 示 了 使 用 深度 优先 遍历 访问 每 一 个 节 扣 的 顺序 。 
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图 8-2 使 用 深度 优先 遍历 图 形 


从 书 点 1 开始 饥 历 ， 书 点 1 与 其 他 三 个 书 点 (2、3 和 4) 具有 关系 并 且 你 将 访问 前 面 没有 访问 过 的 第 一 个 子 节点 一 一 在 这 种 情 
况 下 是 节点 2。 你 可 以 设想 扬 历 器 束 像 一 个 小 的 机 器 人 从 节点 1 通过 关系 a 跳 到 节操 2。 


一 旦 你 检查 节操 2， 你 不 得 不 决定 下 一 步 往 哪 里 走 。 记 住 深 度 优先 的 原则 ， 如 果 有 可 能 的 话 ， 访 问 前 面 没 有 访问 过 的 子 节 


护 。 因 此 你 的 下 一 步 将 从 太 上 2 到 节点 5 (通过 关系 b) 。 仪 仪 两 步 跳跃 ， 你 就 到 了 该 图 形 的 最 深 节 所 一 一 从 根 节 后 (节点 1) 到 
节点 9?。 这 残 是 深度 优先 算法 命名 的 原因 : 以 最 快 的 速度 到 达 图 形 的 最 深 处 。 


现在 你 已 经 在 节点 5 上 了 ， 你 应 该 到 它 的 子 节点 上 ， 但 是 节点 5 是 该 图 形 的 叶 ， 因 此 它 没有 任何 子 节 点 要 访问 。 在 这 种 情况 
下 ， 深 度 优先 算法 有 一 个 规划， 回 到 前 面 没 有 访问 过 的 具有 子 节 点 的 第 一 个 证 点 上 。 你 返回 节操 2， 然 后 使 用 原来 的 规则 。 世 后 
2 具有 两 个 子 书 上 各 (节点 5 和 和 6) ， 你 已 经 访问 过 节点 5， 因 此 ， 下 一 站 是 忆 点 6 (通过 关系 c) 。 


使 用 相同 的 规则 ， 你 将 会 以 下 面 的 节点 顺序 遍历 图 形 。 
1 一 2 一 5 一 6 一 3 一 7 一 8 一 4 一 9 
如 果 你 看 图 8-2， 在 遍历 期 间 你 已 经 通过 a、b、c、d、e、f、g 和 h 的 顺序 进行 了 跳跃 。 


倒数 第 二 个 访问 节点 4 是 非常 有 趣 的 ， 尽 省 那个 节点 非常 靠近 根 节 点 一 一 开始 上 各。 你 也 会 注意 到 图 形 左 边 部 分 的 节操 (节操 


1、2、5 和 6) 比 右边 部 分 的 节点 (节点 4、8 和 9) 更 早 访问 。 这 是 深度 优先 遍历 的 结果 ， 当 在 建 模 图 形 数据 库 和 设计 遍历 时 应 充 
分 利用 这 个 顺序 。 当 在 比较 深度 优先 和 广度 优先 的 顺序 时 我 们 将 再 一 次 进行 讨论 这 一 点 。 


现在 的 问题 是 如 何在 Neo 笑 遍历 APl 中 使 用 深度 优先 算 ; 去 。 使 用 Neo 笑 声 历 API 实 施 我 们 刚刚 搬 述 的 遍历 ， 你 会 在 程序 8-1 中 
看 到 解决 的 方法 。 


【程序 8-1】 使 用 Neo4j 志 历 API 深 度 优 先 志 历 整 个 图 形 
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TraversalDescriptlion traversalDescription = Traversal.description() 
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Iterable<Node> nodes traversalDescription 


LE 了 
本 
A A 


traverse {startNode) 


从 开始 > 
始 通 历 for {Node n : nodes) 1 a ; 了 了 通 历 的 结 十 
System.out .print (node .getProperty("id") + "-»>") 
在 结果 中 渤 代 并 
输出 节点 编号 


| 


首先 ， 需 要 初始 化 遍历 描述 ， 就 像 在 第 4 章 中 当 你 使 用 Neo4j 遍 历 API 时 一 样 (人 @) 。 然 后 ， 设 置 遍历 只 沿 着 往外 的 CHILD 
设置 遍历 的 顺序 为 深度 优先 。 要 实现 这 一 做 法 ， 使 用 专用 的 方法 depthFirst () 作为 


1 


类 型 关系 遍历 (@) 。 下 一 步 ， 
TraversalDescription 创 建 器 的 一 部 分 ( 合 ) 。 

一 旦 这 个 描述 建立 起 来 ， 通 过 指定 起 始 节点 开始 遍历 (人) ， 并 且 返 回 遍历 过 程 中 访问 的 所 有 节点 (上 四) 。 记 住 ， 遍 历 结果 
的 返回 类 型 是 一 个 延迟 Java 可 适 代 的 实例 。 仪 仪 指 定 起 始 节 点 并 且 在 遍历 中 调用 nodes () 并 不 能 访问 任何 节点 。 需 要 在 结果 中 
迭代 以 便 遍 历 器 开始 在 图 形 中 移动 ， 这 里 你 要 做 的 正 是 这 样 (@) 。 在 迭代 期 间 ， 你 可 以 以 希望 的 方式 处 理 访问 的 节点 ， 这 取决 
于 你 所 用 软件 的 需求 。 在 本 例 中 ， 只 要 求 在 控制 人 台 上 输出 节点 属性 的 编号 。 

最 终 的 输出 将 会 证 实 遍 历 图 形 时 确实 用 的 是 深度 优先 算法 规则 。 


— : 


= 3 


四 注意 


深度 优先 是 Neo4j 默 认 的 分 支 顺序 策略 。 当 建立 遍历 描述 时 ， 如 果 不 指定 遍历 的 顺序 ， 则 默认 为 深度 优先 。 


现在 让 我 们 看 一 看 其 他 的 内 置 分 支 选 择 策略 : 广度 优先 。 


走 得 尽 可 能 广 。 作 为 广度 优先 算法 的 一 部 分 ， 刀 历 在 


8.1.2 广度 优先 
顾名思义 ， 广 度 优先 算法 试图 在 图 形 中 从 起 始 忆 点 访问 更 远 的 节操 之 前 走 得 
访问 子 节 扣 之 前 将 首先 访问 当前 节点 的 所 有 同 级 节点 。 同 级 在 这 里 是 指 从 根 节 点 开始 与 你 正在 访问 的 具有 相同 距离 的 古 点 。 图 8- 


3 显示 了 广度 优先 算法 对 前 面 用 过 的 同一 图 形 的 遍历 顺序 。 


图 8-3 样本 图 形 的 广度 优先 遍历 


从 根 节点 1 开始 ， 像 以 前 一 样 ， 通 过 访问 它 的 第 一 个 后 代 节 点 2 继续 (通过 关系 a) 。 下 一 步 ， 访 问 节点 2 的 同 级 节点 ， 移 动 
到 证 点 3， 然 后 节操 4。 一旦 访问 了 书 点 4， 没 有 与 根 书 点 同 距离 的 节点 需要 访问 了 ， 因 此 移动 到 下 一 步 深 度 级 别 上 ， 从 节点 2 的 
子 古 点 开始 ， 以 这 样 的 顺序 访问 匡 点 5 和 节操 6。 然 后 继续 到 节点 7 和 节点 8， 最 后 访问 书 点 4 的 子 古 品 (节操 9) 。 使 用 广度 优先 


算法 访问 的 节点 顺序 如 下 所 示 : 
区 
在 广度 优先 遍历 中 ， 离 根 节点 越 近 的 节点 访问 得 越 早 ， 将 远离 根 节点 的 节点 放 在 后 面 访问 。 
让 我 们 现在 用 广度 优先 策略 更 新 遍历 的 实施 。Neo4D 遍 历 API 的 遍历 描述 创建 器 有 一 个 专用 的 方法 做 这 项 工作 ， 就 像 程序 8-2 
给 出 的 一 样 。 
【程序 8-2】 使 用 Neo4j 人 遍历 API 的 广度 优先 遍历 
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描述 gn <] 设置 广度 
Iterable<Node>s nodes = traversalDescrlipt1ion 做 鞠 策 本 
‘traverse (startNode) 可 
汪 > .moOdaes (1) ; 从 起 始 节 局 
开始 通 爵 


指 for (INode n nodes) 1 a 

TF 1 本 1 1 人] Tf 门 EPS i 人 二 加 看 中 Eh 
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就 像 你 所 看 到 的 ， 代 码 非 常 相似 。 唯 一 的 不 同 是 建立 遍历 描述 时 使 用 了 一 个 不 同 的 方法 来 指定 遍历 的 顺序 ( 合 ) 。 控 制 台 
的 输出 将 会 与 本 节 前 面 建立 的 顺序 相 匹 配 : 


8.1.3 “深度 优先 与 广度 优先 顺序 的 比较 


正 像 你 在 前 面 两 节 中 看 到 的 ,深度 优 先 退 历 支持 从 图 形 的 左边 部 分 搜索 解决 问题 ， 广 度 优先 遍历 在 结果 靠近 起 始 节点 时 会 比 
远离 起 始 节 点 时 更 快 。 这 两 个 特性 在 设计 图 形 数据 库 和 设计 需要 执行 的 饥 历时 是 非常 重要 的 。 


取 图 8-1 中 的 节点 4 作为 一 个 例子 。 如 果 使 用 深度 优先 顺序 从 古 点 1 开始 遍历 图 形 ， 在 找到 书 点 4 之 前 ， 需 要 的 退 历 几乎 走 允 


了 整个 图 形 ， 因 为 这 将 访问 倒数 第 二 的 节点 。 如 果 用 广度 优先 顺序 做 同样 的 工作 ， 书 点 4 将 是 从 起 始 忆 点 算 起 的 第 四 个 忆 点 ， 只 
访问 了 路 径 上 的 一 半 忆 点。 由 于 人 遍历 的 速度 与 跳跃 的 次 数 (或 路 径 上 访问 的 古 点 数 ) 相关 ， 如 果 你 使 用 广度 优先 而 不 是 使 用 深度 


优 乞 ， 你 将 用 一 半 的 时 间 找到 结 
如 果 你 正在 查找 节点 5， 深 度 优先 算法 将 会 用 三 次 跳跃 找到 结果 ， 而 广度 优先 则 需要 五 次 。 


图 形 越 大 ， 亿 历 顺序 对 遂 历 性 能 的 影响 丈 越 大 。 为 了 演示 ,创建 一 个 每 一 个 证 点 正好 有 三 个 子 古 点 的 图 形 数 据 库 。 创 建 一 个 
起 始 节 点 并 连接 其 三 个 子 证 操 。 然 后 ， 取 三 个 子 节操 中 的 每 一 个 证 点 ， 并 添加 三 个 子 忆 点 到 每 一 个 书 点 上 。 然 后 继续 和 直人 至 深度 
12 级 。 结 果 图 形 将 会 有 797161 的 节点 和 797160 个 关系 。 


现在 运行 一 个 饥 历 查 找 指定 深度 上 的 一 个 特定 的 忆 点 。 作 为 测量 性 能 的 一 种 方法 ， 我 们 将 使 用 访问 过 的 节点 数量 作为 测量 依 
据 。 


四 注意 


移动 的 次 数 和 访问 的 节点 数 直接 与 执行 遍历 所 需要 的 时 间 相 关 。 使 用 实际 的 时 间 测 量 性 能 将 使 得 结果 依赖 于 可 用 的 硬件 资源 
以 及 缓存 情况 ， 在 这 个 简单 的 实验 中 ， 我 们 将 尝试 避免 硬件 及 缓存 的 影响 。Neo4j 每 秒 访问 的 节点 数 在 几 万 至 几 百 万 之 间 ， 取 决 
于 硬件 、 缓 存 和 遍历 的 复杂 程度 。 


表 8-1 给 出 了 本 实验 的 结果 。 


表 8-1 遍历 的 性 能 依赖 于 搜索 的 节点 所 在 的 位 置 和 所 用 的 遍历 算法 


本 ET 


6 首先 在 左边 — 364 


12 最 后 往 右 边 797 160 797 160 


就 像 你 在 表 中 看 到 的 ， 当 结果 书 点 靠近 起 始 节 点 上 时， 广度 优先 排序 一 般 会 给 出 较 好 的 性 能 。 但 是 远离 起 始 节 点 时 ， 广 度 优先 
排序 总 是 比较 慢 ， 而 深度 优先 排序 可 能 非常 高 效 ， 取 决 于 结果 节操 是 在 图 形 的 左边 还 是 右边 。 


在 最 坏 的 情况 下 ， 是 整个 图 形 都 需要 遍历 ( 当 结 果 节 点 在 图 形 的 右 下 角 时 ) ， 深 度 优先 和 广度 优先 都 需要 访问 所 有 的 节点 。 


由 于 广度 优先 遍历 需要 更 大 的 内 存 记 忆 遍 历 的 足迹 ， 这 种 情况 下 最 好 使 用 深度 优先 。 


除 速 度 之 外 ， 当 决定 饥 历 的 顺序 时 ， 另 一 个 需要 考虑 的 万 面 是 志 历 的 内 仓 消 耗 。 再 一 次 假设 志 历 器 是 一 个 小 机 器 人 通过 天 系 
从 一 个 节点 跳跃 到 另 一 个 古 点 。 这 个 小 机 器 人 将 必须 记 住 一 些 状态 ， 从 哪个 节点 来 ， 哪 个 节点 已 经 访问 过 。 图 形 越 大 ， 存 储 这 个 
状态 需要 的 内 存 束 越 多 。 但 是 ， 选 择 的 饥 历 顺序 会 影响 需要 的 内 存 大 小 ， 下 面 让 我 们 看 看 情况 如 何 。 


当 使 用 深度 优先 时 ， 你 试图 用 最 快 的 速度 深入 到 图 形 。 一 旦 你 到 了 图 形 的 最 底层 (访问 了 一 个 以 前 没有 访问 过 的 且 没 有 子 节 
所 的 节操 ) ， 你 束 可 以 完全 态 掉 图 形 的 这 个 分 支 一 一 从 亿 历 的 角度 ， 可 以 认为 已 完成 。 在 Neo49 Java 世 界 ， 那 意味 着 你 可 以 从 
内 存 间 接 引用 那 条 路 径 并 且 留 作 垃圾 集 的 清理 。 因 为 这 些 路 径 的 一 些 将 会 在 饥 历 的 早期 访问 ， 你 一 旦 开始 遍历 束 可 以 开始 解除 内 
存 的 分 配 。 


广度 优先 遍历 在 开始 下 一 深度 的 节点 之 前 ,试图 在 图 形 中 走 得 尽 可 能 广 。 因 此 ， 在 退 历 期 间 ， 需 要 记 住 所 有 访问 过 的 节点 和 
哪 一 个 子 节 点 还 没有 访问 。 图 形 越 大 越 复杂 ， 需 要 记 住 的 节操 束 越 多 ,会 导致 一 个 巨大 的 内 存 占用 。 


一 般 来 讲 ， 每 一 个 节操 的 关系 越 多 ， 广 度 优先 需要 的 内 存 束 越 多 ，。 


如 何 选 择 深 度 优先 和 广度 优先 ? 作为 一 个 应 用 程序 设计 师 和 开 友 者 ， 你 必须 认识 到 你 有 一 个 很 大 的 优势 : 你 知道 和 理解 你 所 
操作 的 域 模 型 。 基 于 你 的 域 知识 ， 你 可 以 决定 你 所 使 用 每 一 个 所 历 应 该 使 用 哪 一 个 优先 顺序 (在 同一 个 图 形 中 ， 可 能 随 着 不 同 的 
情况 而 变化 ) 。 


如 果 结 果 靠 近 起 始 节 点 ， 广 度 优先 顺序 可 能 会 更 好 。 但 是 ， 如 果 图 形 非 单 密 〈 即 每 一 个 节点 有 许多 天 系 ) ， 则 广度 优先 顺序 
在 实际 中 可 能 会 使 用 太 多 的 内 存 。 


对 志 历 顺序 的 理解 和 对 问题 领域 的 洞察 将 给 你 一 个 很 好 的 开始 ， 但 是 决定 一 个 总 体 上 最 好 的 志 历 ， 你 需要 以 不 同 的 选项 做 实 
验 。 如 果 Neo4j 的 内 置 顺序 选项 不 匹配 你 的 需求 ， 你 可 以 通过 使 用 org.neo4j.graphdb.traversal.Branchselector 接 口 实施 你 自 
己 的 顺序 ， 这 个 接口 是 Neo 有 4 志 历 API 的 一 部 分 。 自 定义 所 历 实 施 超出 了 本 书 讨论 的 沁 围 ， 但 是 你 可 以 通过 得 看 Neo 有 4 手册 
(http://docs.neo4j.org/) 和 访问 Neo4j Google 群 (https://groups.google.com/forum/#! forumyneo4j) 找到 有 用 的 信 
息 。 


让 我 们 看 看 能 帮助 你 决定 如 何在 遍历 期 间 从 当前 节点 跟踪 关系 的 Neo 笑 机制: 路 径 扩展 器 。 


8.2 扩展 天 系 


扩展 器 是 Neo4D 刀 历 API 的 一 个 部 件 ， 负 责 决 定 退 历 期 间 访 问 过 的 任 蕊 节 点 应 该 跟 路 哪个 关系 。 除 选择 关系 类 型 和 访 同 外 ， 
扩展 器 还 负责 跟 蹊 天 系 的 顺序 。 


Neo4j 提 供 了 许多 现成 的 扩展 器 实施 。 默 认 的 实施 是 一 个 最 单 用 的 standardExpander。 
8.2.1 标准 扩展 器 


标准 扩展 器 (StandardExpander) 封装 在 StandardExpander 中 ， 它 提供 了 一 系列 内 置 扩展 器 允许 你 指定 想 要 跟 路 的 关 
系 ， 包 括 关 系 的 方向 。 关 系 的 扩展 是 按照 它们 加 入 图 形 的 顺序 进行 的 。 


四 注意 


StandardExpandet 是 Neo4j 饥 历 API 使 用 的 默认 实施 。 


| 考虑 下 面 的 例子 : 在 一 个 社交 网 络 中 ， 一 起 工作 的 人 们 通过 一 个 WORKS_WITH 天 系 
连接 起 来 ， 并 且 是 密切 朋友 的 人 们 通过 IS_FRIEND_OF 关 系 连 接 起 来 。 图 8-4 给 出 了 我 们 将 使 用 的 样本 图 形 。 


现在 我 们 想 做 的 是 吾 找 John 的 直接 天 系 ee 喜欢 的 所 有 电影 。 看 一 下 图 8-4， 你 期 竺 的 结果 将 包含 


Et Top Gun 不 应 该 是 结果 的 一 部 分 ， 因 为 它 只 是 John 自 己 喜 欢 的 。Godfather 和 Great Dictator 不 应 该 是 结果 的 


， 因 为 只 是 John 朋 友 的 朋友 喜欢 的 (你 只 想 要 John 的 直接 关系 喜欢 的 电影 ) 。 


; name: John : LIKES [title: IOP Gun 二 i 


[ 


ti1itie: Fargo 亡 pp Ss 
k + | 


Ea WORKS WlITH 


TS FRIEND OF 


name*: Kate 


name: Ermima 


> 3 


name: Alewx title: Alien 


title: 
Godfather 


title: Great 
Dictator 


图 8-4 ”一 个 用 户 和 他 们 喜欢 的 电影 的 社交 网 络 


程序 8-3 演 示 了 这 个 遍历 的 实施 。 


【程序 8-3】 ”查找 John 的 朋友 和 同事 喜欢 的 所 有 电影 


TraversalDescription traversal = Traversal .descripticn1) Ts 添加 要 书展 


合用 山 > ,Expandl (PathExpander) StandardExpander , DEFAULT 的 关系 类 再 
二 .add (WORKS WITH) 
| 让 5 1 起 
六 :add (IS FRIEND OF) 2 
访问 标 .add (LIKES)) 了 竹 昌 经 皆 奉 中 只 考 息 
准 扩 展 .evaluator (Evaluators.atDepth (2)) < 深度 2 上 的 半点 ; 
器 实例 > .evaluator {new Evaluator{) 1 家 这 2 后 早 素 读 上 万 
@Override 
public Evaluation evaluate{PFath path) 1 
只 和 得 if (path.endNode() .hasProperty("title")) 1 
i return Evaluation.INCLUDE AND CONTINUE ; 
和 切 盯 中 \ 
的 电影 return Evaluation.EXCLUDE AND CONTINUE ; 
ps 
Iterable<Node> nodes = traversal.traverse ljohn) .nodes{) 2 ed rote ir 
for (Node nn : nodes)} 1 字 到 控制 台 
System.cout .println{n.getProperty("title")).; 


Be 


使 用 TraversalDescription.expand (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 设置 遍历 要 使 用 的 扩展 器 (人 @) 。 使 用 静 
态 出 厂 方法 实例 化 StandardExpander， 然 后 添加 要 跟踪 的 关系 (@) 。 因 为 你 是 在 查看 John 的 直接 联系 人 看 过 的 电影 ， 你 想 
要 只 包括 深度 2 上 的 节点 并 且 在 这 之 后 停止 遍历 (全) 。 确 保 在 结果 中 仅仅 返回 电影 节点 (例如 ， 没 有 用 户 节点 ) ， 需 要 添加 另 
一 个 评估 器 检查 节点 上 的 title 属 性 ， 因 为 只 有 电影 节点 具有 这 个 属性 (人) 。 最 后 ， 从 代表 John 的 节点 开始 遍历 ， 并 将 电影 名 
字 输 出 到 控制 台 (@) . 


一 旦 查询 被 执行 ， 期 竺 的 结果 输出 到 控制 合 上 。 


Fargo 
B11en 


在 代码 中 ， 传 递 内 置 于 StandardExpander 中 的 扩展 器 到 TraversalDescri 
ption.expand (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 中 以 选择 每 一 个 节点 要 跟踪 的 关系 。 但 是 
因为 standard Expander 是 TraversalDescription 创 建 器 使 用 的 默认 扩展 器 ， 你 可 以 方便 地 使 用 它 的 便捷 方法 选择 要 扩展 哪 一 个 
关系 ， 使 代码 更 清晰 、 更 简洁 。 下 面 的 程序 给 出 了 如 何 从 程序 8-3 使 用 这 一 句法 更 新 遍历 。 为 了 清晰 起 见 ， 程 序 8-3 中 的 部 分 已 


TraversalDescription traversal = Traversal . 已 BCIEILPtLCODT ) 
.relationships (WORKS WITH) 4 使 用 TraversalDescri- 
.Telationships (IS FRIEND OF) ption.relationships(...) 
.relationships (LIKES) 方法 添加 需要 的 关系 


在 这 段 程序 中 使 用 了 TraversalDescription.relationships (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 添加 你 想 扩 展 的 关系 类 型 (@) 。 因 为 
StandardExpander 是 默认 的 ， 这 将 导致 在 诡 层 被 执行 的 代码 与 程序 8-3 的 代码 完全 一 样 ， 这 里 在 句法 上 稍微 索 凑 一 些 。 


程序 8-3 中 的 代码 看 上 去 更 像 本 书 中 前 面 遍历 用 过 的 代码 ， 但 是 你 现在 知道 在 它 的 背后 是 StandardExpander 的 行为 。 使 用 


TraversalDescription.expand (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 ， 你 可 以 控制 任何 遍历 使 用 哪 一 个 扩展 
器 ， 下 一 证 将 介绍 如 何 利 用 这 种 灵活 性 。 


在 下 面 的 两 节 中 ， 我 们 将 学 习 如 何 使 用 非 默 认 的 扩展 器 在 退 历 中 的 实现 。 首 先 ， 让 我 们 以 顺序 关系 扩展 器 开始 。 


8.2.2 ”用 于 扩展 的 顺序 关系 


正如 你 所 看 到 的 ，StandardExpander 具 有 一 个 限制 一 一 要 扩展 的 关系 顺序 是 固定 的 ， 它 使 用 创建 时 的 关系 顺序 。 在 大 部 分 
情况 下 ， 这 是 一 个 合理 的 限制 ， 因 为 大 部 分 毅 历 以 同样 的 方式 对 待 每 一 个 天 系 类 型 。 但 是 在 一 些 情况 下 将 会 挑选 一 个 特定 的 顺序 
扩展 关系。 让 我 们 使 用 前 面 一 节 的 同一 个 图 形 (图 8-4) 来 演示 使 用 顺序 关系 的 情况 。 


就 像 在 前 一 节 中 ， 我 们 将 查找 John 的 所 有 直接 联系 人 喜欢 的 所 有 电影 (包括 朋友 和 同事 ) 。 这 一 次 ， 我 们 将 挑选 John 的 密 
友 喜 欢 的 电影 ， 把 它们 放 在 结果 清单 的 最 前 面 。 你 将 期 待 以 指定 的 顺序 (与 以 前 不 同 ) 获得 与 以 前 同样 的 遍历 结果 。 


1) Alien (由 John 的 朋友 Emma 推荐 ) 。 
2) Fargo (由 Kate 推 荐 ，Kate 是 John 的 同事 ) 。 


在 扩展 之 前 ， 你 可 以 通过 使 用 OrderedByTypeExpander 很 容易 地 根据 类 型 排序 关系 。 而 不 是 使 用 默认 的 
StandardExpander， 如 程序 8-4 所 示 。 


【程序 8-4】 ”以 关系 的 类 型 顺序 扩展 关系 


PathExpander expander = 


new OrderedByTypeExpander (| < 空 例 化 OrderedByType 
.add (IS FRIEND OF) | +E 
| S T Expander 
.add (WORKS WITH) - <pand 


.add (LIKES)., 
TraversgalDescription traversal = 
Traversal .description') 
.expand (expander) < 卡 用 配置 的 
.evaluator (Evaluators.atDepth (2)) | i 
.evaluator(new Evaluator() 1 | ES 
EOverride Ee ee 
public Evaluation evaluate{(Path path) 1 
if (path.,endNode() .hasProperty("title")})1 
return Evaluation.INCLUDE AND CONTINUE ; 
} 
return Evaluation.EXCLUDE AND CONIINUE ; 
1); | 
Iterable nodes = traversal .traverse (john) .nodesl).; 
for (Node n: nodes})t1 
Svstem.out .println ln,getProperty ("title")):; 


使 用 默认 的 构造 器 实例 化 新 的 扩展 器 (@) ; 然后 添加 要 跟踪 的 关系 类 型 (@) 。 对 每 一 个 访问 的 节点 ， 指 定 的 关系 类 型 
确保 以 同样 的 顺序 扩展 ， 因 为 它们 被 添加 到 扩展 器 中 。 因 为 你 想 要 IS_FRIEND_OF 关 系 忌 是 首先 被 所 历 ， 所 以 把 它 首 先 添加 到 代 
码 中 。 


要 使 用 新 创建 的 扩展 器 ， 使 用 TraversalDescription.expand (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) 方法 指定 它 (个) 。 程 序 的 其 余部 分 与 以 前 的 


一 样 。 
当 你 执行 这 个 遍历 时 ， 结 果 将 与 期 望 的 完全 一 样 。 
Alien 
Fargdo 
当 你 设计 刀 历 时 ，OrderedByTypeExpander 可 以 提供 更 强大 的 功能 。 然 而 ， 在 一 些 情况 下 ， 没 有 Neo 和 内 置 的 遍历 提供 需 


求 的 功能 。 在 这 种 情况 下 ， 你 可 以 使 用 Neo4j 饥 历 API 实 现 你 自己 的 自 定 义 扩展 器 ; 这 就 是 我 们 将 要 在 下 一 节 中 介绍 的 。 


8.2.3” 目 定义 扩展 器 


当 你 需要 建立 一 个 满足 你 的 需求 的 自 定 义 扩 展 器 时 ，Neo4j 有 一 个 可 用 的 遍历 扩展 点 。 这 个 扩展 APl 是 用 PathExpander 接 
口 定义 的 ， 它 是 Neo4j 核 心 库 的 一 部 分 。 
PathExpander 接 口 定 义 了 你 需要 实施 的 两 个 方法 。 


* Iterableexpand<Relationship>expand (Path path，BranchStatestate) ; 这 个 方法 包含 决定 遍历 从 当前 节点 应 该 跟踪 哪个 关系 的 
逻辑 (并且 以 哪个 顺序 ) 。 参 数 path 包 含 在 图 形 中 遍历 到 当前 节点 的 完整 路 径 (包括 节点 和 关系 ) 。 你 可 以 像 通常 一 样 使 用 路 径 


对 象 的 所 有 可 能 方法 。 例 如 : 
-Path.endNode () ”获得 当前 芒 问 的 古 点 。 
-Path.startNode () ”获得 遍历 开始 的 节点 。 
-Path.lastRelationship () 取 回 在 图 形 中 到 达 当 前 节点 之 前 妃 历 的 最 后 关系 。 


除 人 遍历 的 路 径 之 外 ， 还 访问 了 另 一 个 方法 的 参数 BranchState， 它 代表 有 关 遍 历 的 当前 分 支 的 状态 。 它 是 可 选 的 ， 并 且 一 般 
的 扩展 器 并 不 使 用 它 。 


* PathExpander<STATE>reverse () ; 这 个 方法 以 同样 的 扩展 逻辑 返回 到 扩展 器 ,但 是 以 相反 的 方向 ， 并 且 一 般 用 于 双向 遍 


历 (在 本 章 后 面部 分 将 进行 讨论 ) 。 考 虑 reverse 方 法 作为 你 需要 使 用 的 扩展 器 以 获得 从 当前 节点 返回 到 人 遍历 的 起 始 节点 。 


现在 让 我 们 实现 一 个 样本 目 定 义 扩 展 器 。 基 于 本 节 中 前 面 使 用 的 这 个 相同 的 社交 网 络 图 形 (参见 图 8-4) ， 我 们 将 要 设计 一 
个 轴 历 ， 将 再 次 查找 John 的 直接 联系 人 喜欢 的 所 有 电影 。 但 是 ， 不 是 使 用 标准 的 Neo4j 志 历 API 部 件 ， 包 括 自 定义 评估 器 ， 我 们 
将 使 用 目 定 义 PathExpander 实 现 。 


这 个 查询 的 主要 难点 是 避 开 所 有 John 喜 欢 的 电影 ， 还 有 John 的 朋友 的 朋友 喜欢 的 任何 电影 。 为 了 实现 这 个 目标 ， 我 们 将 目 
定义 一 个 具有 以 下 特性 的 扩展 器 : 


. 仅仅 跟踪 从 起 始 节 点 开始 的 IS_FRIEND_OF 和 WORKS_WITH 关 系 (代表 John) 。 
: 对 所 有 在 深度 1 访问 过 的 节点 (代表 John 的 朋友 和 同事 ) 仅仅 跟踪 LIKES 关 系 。 


使 用 内 置 的 TraversalDescription 方 法 和 StandardExpander， 不 可 能 创建 一 个 县 有 这 些 性 质 的 遍历 。 但 是 你 可 以 实现 一 个 
自 定义 PathExpander。 程 序 8-5 给 出 了 一 个 这 样 的 扩展 器 的 实现 。 


【程序 8-5】 ”基于 从 起 始 忆 点 的 距离 扩展 关系 


public class DepthAwareExpander implements PathExpander! 二 PatheExpander 
private final Map<Integer, List<RelationshipType>> 俊 口 实施 

使 用 java. 上 relationshipToDeptnMappiling: 
util.Map 
对 象 存储 重 Public DepthAwareExpander (Map<Integer, List<RelationshipType>> 
对 多 行 情 汪 ， 机 i i 
全 relationshipToDepthMapping) | 在 Expangd 
中 嗓 时 通 册 this,.relationshipToDepthMapping = relationshipToDepthMapping.; 市 法 
i | 巴林 起 EE -= = = 下 
汪 开 交 间 的 2 把 二 
区 @Override 于 回 
映射 a : | 
| Public Iterable<Relationship> expandlPFath path, BranchSstate state) 《< 


Lit depth pati:lengtht): | < 查找 裔 历 的 
List<RelationshipType> relationshipTypes = u 前 深度 
= 刚 上 二 
在 当前 的 深度 查 > relationshipToDepthMapping.get (depth):; - 


return path,endNode!) 


找 要 聚 踪 的 关系 z 
:etRelatlionshipsl 


(从 映射 中 ) :a \ ee | 
ee relationshiplypes.tohrray (new RelationshipType ld0]) 
1 i 
} 扩展 当前 节点 配置 过 的 类 型 的 所 
有 关系 
Override 


Public PathExpander reverasel) | 
/omitted for clarity 


DepthAwareExpander 从 Neo4j 核 心 API 实 现 PathExpander 接 口 (人 @) 。 要 映射 从 起 始 节 点 (或 深度 ) 到 关系 类 型 的 距 
离 ， 可 以 使 用 一 个 简单 的 java.util.Map (@)， 


要 实现 的 关键 方法 是 expand (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15631/OEBPS/Text/...) ， 这 个 方法 扩展 了 从 你 当前 访问 的 节点 到 你 应 
该 跟踪 的 关系 (全) 。 当 前 访问 节点 的 深度 可 以 用 Path.length () 方法 找到 (人 @@) 。 下 一 步 ， 在 给 定 的 深度 从 配置 的 映射 查找 


关系 (全) 。 最 后 ， 你 从 当前 的 节点 返回 指定 类 型 扩展 的 关系 (@) 。 使 用 Path.endNode () 方法 定位 当前 的 节点 。 
下 一 步 是 在 退 历 中 使 用 目 定 义 扩展 器 。 程 序 8-6 给 出 了 一 个 输出 结果 到 控制 台 的 饥 历 的 例子 (John 的 直接 朋友 喜欢 的 电影 
字 ) 


子 


【程序 8-6】 ”使 用 一 个 自 定义 扩展 器 查找 John 的 朋友 喜欢 的 所 有 电影 


HashMap<Integer, List<RelationshipTypes> mappings = 

new HashMap<Integer, List<RelationshipType>>|()}):; 
mappings .Put (0, Arraves.,asList ( 

iW RelationshipType[] {IS FRIEND OF， WORKS WITH | 

用 让 ea 
mappings .put (1, Arrays.asList ( 0 配置 尝 度 / 关系 隐身 

new RelationshipType[] {LIKES}))).; 


TraversalDescription travergsgal = i 
en a 了 a 使 用 DepthAwareExpander 
Traversal .descript1ont) 


、 ， 作为 一 小 闹 历 扩 展 点 
,Expand (new DepthhwareExpander (mappings}) 让 六 | 通 历 坟 展 垩 


:Evaluator (Evaluators.atDepth lz) < 仅 挨 回 深度 2 的 节点 
| i 
Iterable<Node> nodes = traversal .traverge lJohn}) .nodes'!()., 
fortNode n: nodes) | 从 John 开始 浪 毛 ， 关 
System.out .printlnin.getProperty ("title"))}).; 目 答 出 站 果 到 控制 各 


| 


第 一 步 是 配置 在 每 一 深度 上 要 跟踪 的 关系 ( @) 。 映 射 是 跟踪 直接 从 起 始 节 点 (深度 0) 的 IS_FRIEND_OF 和 
WORKS_WITH 关 系 和 从 深度 1 节点 的 LIKES 关 系 。 遍 历 实施 的 关键 点 是 使 用 自 定义 扩展 器 配置 遍历 描述 (@) 。 由 于 你 感 兴趣 的 
节点 仅仅 到 深度 2， 可 以 使 用 atDepth 评 估 器 在 指定 的 深度 停止 遍历 (全) 。 最 后 ， 从 代表 John 的 节点 开始 遍历 并 以 通常 的 方法 
在 结果 中 迭代 ( 令 ) . 


当 执 行 这 个 遍历 时 ， 控 制 台 的 输出 将 会 显示 期 望 的 电影 《Alien》 和 《Fargo》， 这 是 John 的 直接 关系 人 喜欢 的 电影 。 


我 们 将 讨论 的 下 一 个 主题 是 高 级 Neo4j 思 历 API 的 唯一 性 ， 因 此 ， 让 我 们 继续 阅读 本 书 来 学 习 如 何 控制 志 历 访问 节点 和 天 系 
的 次 数 。 


8.3 ”管理 唯一 性 


饥 历 的 唯一 性 问题 决定 在 志 历 期 间 你 能 访问 一 个 节 氮 多 少 次 。 在 Neo4j 的 贺 历 API 中 ， 有 几 个 不 同 的 唯一 性 设置 ， 它 们 能 
于 你 的 思 历 中 。 在 本 节 中 ， 我 们 将 演示 尼 们 的 使 用 和 行为 。 所 有 可 用 的 唯一 性 选项 是 在 Neo4j Java 库 中 的 Uniqueness 类 中 作为 
单数 访问 的 。 


8.3.1 NODE GLOBAL 唯一 性 


Neo4j 声 历 中 最 典型 的 唯一 性 设置 是 NODE GLOBAL。 它 基本 上 意味 着 每 一 个 节点 只 能 访问 一 次 并 且 在 亡 历 期 间 只 能 访问 


一 次 。 
因 注 总 
NODE_GLOBAL 是 默认 的 遍历 设置 ， 因 此 ， 如 果 你 不 指定 唯一 性 ， 这 样 的 设置 会 在 你 的 遍历 中 使 用 。 


NODE GLOBAL 是 遍历 的 一 般 需求 ， 因 此 让 我 们 用 一 个 例子 中 来 演示 。 让 我 们 看 一 个 简单 的 社交 网 络 图 形 ， 具 有 6 个 代表 用 
户 的 节点 和 互相 认识 的 用 户 之 间 的 KNOWS (认识 ) 关系 。 图 8-5 给 出 了 这 个 简单 社交 网 络 图 。 


| 3.Kate 


KNOWS NU 


ENOWS 


图 8-5 ”一 个 简单 的 社交 网 络 图 
让 我 们 实施 一 个 遍历 顺 着 问题 寻找 解决 方案 : 谁 是 将 用 户 1 (Jane) 介绍 给 用 户 ? (Ben) 的 直接 联系 人 ? 
程序 8-7 给 出 了 使 用 NODE_GLOBAL 唯 一 性 实施 的 需求 亿 历 。 


【程序 8-7】 ”查找 将 Jane 介 绍 给 Ben 的 直接 联系 人 


Traversal .descriptionl) 关系 蔬 建 遍历 
.relatlionships (ENOWS) 
.evaluator (new Evaluator() 1 
多 Overrlide 
public Evaluation evaluatelPath path) 1 
Node currentNode = path.endNode(); 


' 3 8 本 BH EE Trnmm To 
TraversalDescrliption descrlptlion = 了 2 RNOWS 


if (currentNode.getId{() == ben.getId()) | [2 当 到 这 目标 节 反 
return Evaluation.EXCLUDE AND PRUNE; [ (Ben) 时 ,停止 
| 遍历 
在 当前 节点 和 目标 节点 Path ginglePath = GraphAlgoFactory 
ee | .ShortestPath i 
bs T = | 日 | -4 站 了 WU EE 
(Ben) 之 同 查 找 直 挫 Traversal .expanderForTypes (KNOWS), 1) 类 2 
路 痉 > findsinglerath'{lcurrentNode, ben)., 得 存 在 ， 将 
if {singlePath != null) 1 该 市 扣 包 全 
| L | 
i /direct link exlistea : 姓 时 由 
辣 业 青 扩 小 必 \ Sts | 在 结果 中 
2 return Evaluation.INCLUDE AND CONTINUE; < 
不 存在 ， 味 过 } else 1 
变 凶 点 并 溉 绎 > return Evaluation.EXCLUDE AND CONTINUE ; 
|) 
uniquenass (Uniquenaess .NODE GLOBAL):; 
Iterable<Node»> nodes = description,.traverseliane) .nodes(): 
设置 NODE_GLOBAL 的 从 Jane 节 所 开始 遍历 着 返回 
唯一 性 所 有 节操 


用 一 般 的 方法 创建 遍历 ， 并 配置 使 其 在 任意 方向 跟随 KNOWS 关 系 ( @) 。 然 后 利用 一 个 自 定义 评估 函数 用 以 确定 访问 过 的 
节点 是 否 应 该 包含 在 结果 中 。 评 估 函 数 的 第 一 步 是 如 果 到 达 目 标 节点 (在 这 种 情况 下 是 Ben) ， 则 停止 遍历 (@) 一 一 在 她 遇 
见 他 后 ， 就 没有 地 方 检查 谁 将 Jane 介 绍 给 Ben 了 。 下 一 步 ， 试 图 查找 在 当前 节点 与 代表 Ben 的 目标 节点 之 间 的 一 条 直接 的 路 径 ( 
合 ) 。 你 正在 使 用 Neo4j 的 内 置 图 形 算法 计算 直接 路 径 (使 用 GraphAlgoFactory 类 ) 。 如 果 一 条 直接 路 径 存 在 ， 这 意味 着 你 找 


到 了 一 个 节点 ， 他 可 以 将 Jane 介 绍 给 Ben， 因 此 ， 应 该 将 当前 节点 包含 在 结果 中 (@) 。 如 果 没 有 直接 连接 ， 则 跳 过 该 节点 并 继 
续 人 遍历 (@) . 


做 这 个 实验 的 主要 原因 是 要 演示 唯一 性 ， 因 此 使 用 遍历 描述 创建 器 的 uniqueness () 方法 设置 NODE GLOBAL 到 需要 的 设 
置 (@) 。 最后， 从 代表 Jane 的 节点 开始 遍历 并 返回 所 有 的 节点 (@) 。 


如 果 运 行 这 个 遍历 并 将 结果 输出 到 控制 台 ， 你 将 会 看 到 一 个 单一 的 结果 : 
JjJohn 
可 以 通过 查看 图 8-5 的 图 形 确认 John 是 Jane 网 络 中 唯一 能 将 她 介绍 给 Ben 的 人 。 
下 面 让 我 们 扩展 这 个 实验 ， 了 解 NODE_PATH 唯 一 性 设置 。 

8.3.2 NODE PATH 唯一 性 


NODE_PATH 唯 一 性 设置 指定 了 从 起 始 书 点 到 当前 证 后 ， 没 有 路 径 可 以 被 亿 历 两 次 。 多 次 访问 同一 个 节点 是 允许 的 ， 但 只 有 
它们 属于 不 同 的 路 径 才 可 以 。 


让 我 们 通过 修改 氨 历 NODE_PATH 的 唯一 性 更 新 程序 8-7， 并 且 保 持 其 他 志 历 设置 完全 一 样 ， 再 次 运行 这 个 查询 。 程 序 看 上 
去 将 非常 相似 ， 如 程序 8-8 所 示 。 为 了 清晰 起 见 ， 部 分 代码 省 略 了 。 


【程序 8-8】 ”使 用 NODE PATH 唯一 性 做 连接 


TraversalDescription description = 

Traversal 

.degscriptiornl) 

.relatioconships (KNOWS) 

.evaluator (new Evaluator() :| 
EOverrlide 
public Evaluation evaluate(l!Path path) | 

/i omitted for clarity 
Ln 


J t 


.Uniqueness (Uniqueness .NODE PATH) ; 汉 ps 
Iterable<Node> nodes = description.traverse (jane) .nodes'!).; 和 一 


这 段 代码 的 唯一 不 同 是 用 于 设置 唯一 性 的 常数 不 同 : NODE PATH (@) .。 


如 果 你 运行 这 个 查询 ， 输 出 将 会 如 下 所 示 : 


John 
John 
输出 John 两 次 一 一 在 结果 中 有 两 个 入 口 ， 尽 管 两 个 代表 同一 个 节点 。 为 什么 会 发 生 这 样 的 事 ? 仔细 看 一 下 图 8-5 的 图 形 。 


Jane 确 实 通过 John 连 接 到 了 Ben。 但 是 还 有 一 条 路 径 连 接着 jane 和 Ben ， 即 通过 Kate 和 John 的 路 径 。 这 是 图 形 中 的 不 同 路 径 ， 
因为 你 是 在 使 用 NODE PATH 唯一 性 ， 两 者 都 代表 了 有 效 结 


以 前 ， 你 只 得 到 了 一 个 结果 ， 因 为 两 条 路 径 (Jane 一 John 一 Ben 和 Jane 一 Kate 一 John 一 Ben) 都 经 过 John 节 点 ， 并 且 由 
于 你 使 用 NODE GLOBAL 唯一 性 ， 第 二 条 路 径 从 来 没有 经 过 。 


为 了 进一步 演示 这 一 差别 ， 让 我 们 稍微 改变 一 下 遇 历 查询 ， 用 以 查找 通过 Jane 目 己 的 直接 联系 人 到 Ben 都 有 什么 路 径 。 


A 


为 了 回答 这 个 问题 ， 你 必须 明日 你 不 仅仅 只 对 认识 Ben 的 用 户 感 兴趣 ， 而 是 在 Jane 和 和 Ben 之 间 路 径 上 的 所 有 节点 。 所 有 你 不 
得 不 修改 饥 历 的 结果 ， 如 下 面 的 程序 所 示 : 


TraversalDescription description = Traversal .descript1ion'!l) 
.relationships (KNOWS) 像 以 前 一 办 使 用 
FE [ En iT = 下 二 可 本 可 1 T Bee 
.Evaluator (new Evaluator() 1 NODE PaTH 唯 
Overrlide .可 


public Evaluation evaluate (Path path) 1 


}) 派 回 来自 遍历 


; PTT 4 - 酮 所 者 政和 上 称 
.Uniqueness (Uniqueness NODE PATH) ; < 的 所 有 路 径 
Iterator<Paths paths = description.traverseljane) .iterator(); 


遍历 描述 保持 与 以 前 完全 一 样 ， 包 括 NODE_PATH 唯 一 性 (人 @) 。 唯 一 的 变化 是 从 遍历 返回 路 径 而 不 是 返回 节点 (@) 。 
这 段 代码 的 控制 台 输 出 将 会 是 这 样 : 


(Jane) [ENOWS, 0] - -> {John) 
(Jane) [ENOWS ,1] --»> (Kate) <-- [KNOWS ,4] (John) 


这 一 次 可 以 非常 清楚 地 看 到 为 什么 有 两 个 John 记 点 一 一 它们 是 不 同 路 径 的 部 分 。 基 于 这 些 结果 ，Jane 有 两 个 选项 。 


` 她 可 以 联系 John，John 直 接 认 识 Ben。 


` 她 可 以 联系 Kate，Kate 能 够 联系 John。 如 果 Jane 仅 仅 认识 John， 而 Kate 是 她 的 最 好 朋友 并 且 与 John 一 起 工作 ! 这 可 能 就 是 一 
个 有 效 的 选择 。 


NODE_ GLOBAL 和 NODE_PATH 是 使 用 的 最 典型 的 唯一 性 ， 但 是 Neo4 提 供 了 其 他 一 些 唯一 性 类 型 ， 可 能 在 某 些 情况 下 有 
用 。 在 下 一 证 中 ， 我 们 将 简要 介绍 一 些 其 他 唯一 性 类 型 。 


8.3.3 ”其 他 唯一 性 类 型 


NODE_GLOBAL 和 NODE_PATH 也 许 是 最 常用 的 两 种 刀 历 唯一 性 类 型 。 但 是 为 了 完整 性 ，Neo4 雹 历 APl 包 括 其 他 六 种 类 


RELATIONSHIP_GLOBAL 唯 一 性 声明 图 形 中 的 每 一 个 关系 只 能 被 访问 一 次 。 如 果 图 形 中 节点 之 间 具 有 多 个 关系 ， 每 一 个 节 
点 的 访问 次 数 是 连接 该 节点 的 关系 数 。 


RELATIONSHIP_PATH 唯 一 性 与 NODE_PATH 唯 一 性 相似 ， 其 中 的 关系 能 被 多 次 访问 ， 只 要 从 起 始 节 点 到 当前 书 点 之 间 的 
关系 组 合 是 唯一 的 。 这 种 唯一 性 设置 也 可 以 使 书后 被 多 次 访问 。 


当 设 置 NODE_ GLOBAL 唯一 性 或 者 RELATIONSHIP_GLOBAL 唯 一 性 时 ， 遍 历 可 能 耗 尽 内 存 ， 尤 其 是 在 有 很 多 连接 的 大 型 图 
形 数据 库 中 。 由 于 唯一 性 的 限制 原因 ， 每 一 个 节点 (在 NODE_GLOBAL 唯 一 性 的 情况 下 ) 或 关系 (在 RELATIONSHIP_GLOBAL 
唯一 性 的 情况 下 ) 都 必须 记忆 。 这 里 NODE RECENT 和 RELATIONSHIP RECENT 设置 开始 起 作用 。 当 使 用 这 些 设置 时 ， 唯 一 性 
的 限制 稍微 可 以 放宽 。 


对 于 NODE RECENT， 记 忆 访 问 过 的 节点 有 一 个 上 限 数 。 这 个 规则 对 NODE GLOBAL 也 是 一 样 的 ， 即 一 个 节点 只 能 访问 一 
次 ,但 是 只 是 最 近 访 问 的 节点 集合 才 被 记忆 用 于 比较 。 最 近 访 问 需 要 记忆 的 节点 能 够 以 第 二 个 参数 传递 给 唯一 性 方法 ， 如 下 面 的 
程序 所 示 : 


TraversalDescription descrintion = Traversal .descrintiont! 
je LR 


.UNOUeness (Unligqueneses. NODE RECENT, 1000) 


RELATIONSHIP_RECENT 与 RELATIONSHIP_GLOBAL 具 有 同样 的 规则 ， 因 此 关系 只 能 被 访问 一 次 。 但 是 在 雹 历 期 间 ， 只 
指定 的 一 些 天 系 被 记忆 用 于 比较 。 可 以 使 用 第 二 个 参数 对 唯一 性 方法 设置 需要 记忆 的 最 近 访 问 的 天 系 ， 如 下 面 的 程序 所 示 : 


TraversalDescriptlion description = Traversal.descriptionl) 
.Uniqueness (Unliqueness.RELATIONSHIP RECENT, 1000) 


从 Neo4j 1.8 版 本 开始 ， 遍 历 API 包 括 两 个 更 多 的 设置 : 


NODE_LEVEL 确保 处 于 同一 级 的 节点 〈 从 起 始 节 点 开始 具有 相同 距离 的 节点 ) 在 遍历 期 间 只 被 访问 一 次 。 


RELATIONSHIP_ LEVEL 确保 处 于 同一 级 的 关系 〈 从 起 始 节 点 开始 具有 相同 距离 的 关系 ) 在 遍历 期 间 只 被 访问 一 次 。 


在 下 一 世 中 ， 我们 将 讨论 双 同 遍历 ， 这 是 可 以 大 大 增加 疡 历 性 能 的 一 种 类 型 。 


8.4” 双 同志 历 


在 到 目前 为 止 你 所 尝试 的 所 有 遍历 都 是 从 选 定 的 单一 起 始 节 点 开始 遍历 直到 找到 答案 ,或 者 直到 走 遍 整个 图 形 。 你 还 没有 从 
多 个 起 始 节 点 开始 遍历 图 形 。 这 是 直到 Neo4j 遍 历 API 1.8 版 本 才 实 现 的 功能 。 下 面 我 们 介绍 双向 遍历 的 概念 。 


让 我 们 考虑 一 个 拥有 一 干 个 用 户 的 典型 社交 网 络 图 ， 与 图 8-5 的 图 形 相似 。 互 相 认 识 的 用 户 通 过 KNOWS 关 系 相互 连接 。 在 
这 样 一 个 图 形 中 的 其 中 一 个 典型 的 遍历 查询 会 是 “被 选 定 的 两 个 用 户 〈 用 户 1 和 用 户 2) 是 在 一 个 网 络 中 吗 ” ( 换 句 话说， 被 选 
定 的 用 户 是 否 连 着 ， 如 果 连 着 ， 情 况 怎 样 ) ? 


可 以 使 用 标准 的 遍历 API 解 决 这 个 问题 : 从 用 户 1 开 始 ， 跟 着 KNOWS 关 系 ; 对 每 一 个 访问 过 的 节点 ， 检 查 这 个 节点 是 否 是 用 
户 2。 如 果 是 用 户 2， 你 找到 了 这 个 连接 ; 如 果 不 是 用 户 2， 则 继续 查找 ， 直 到 走 遍 全 图 形 。 这 是 一 个 完全 有 效 的 解决 方案 ， 但 是 
如 果 这 个 图 形 非 党 大 并 且 密 密 矿 麻 的 连 看 ， 找 到 答案 将 相当 费时 间 。 


如 果 你 从 用 尸 1 沿 荐 用 尸 2 的 万 同 开 始 志 历 ， 同 时 从 用 尸 2 沿 着 相反 的 万 向 重新 开始 一 个 遍历 将 会 怎样 ? 当 这 两 个 遍历 相遇 时 
( 称 作 础 撞 点 ) ， 你 将 已 经 找 人 天 了 这 个 连接 ， 并 且 可 以 确定 用 尸 之 间 的 整个 路 径 。 这 就是 双 同 遍历 允许 你 做 的 事情 。 图 8-6 演 示 
了 实践 中 的 双向 壳 历 。 


双向 饥 历 涉及 额外 的 遍历 APlI 部 件 (我 们 以 前 还 没有 见 到 ) 。 


“Start-side ttavetsal ”双向 遍历 开始 侧 (出 侧 或 标准 侧 ) 的 遍历 定义 。 这 个 遍历 描述 是 使 用 本 书 通 篇 使 用 的 标准 一 个 方向 的 


遍历 API 创 建 的 。 
. End-side traversd “双向 遍历 结束 侧 ( 进 侧 ) 的 遍历 定义 。 


Collision evaluatof 每 一 次 起 始 侧 与 结束 侧 遍 历 碰撞 ， 都 有 一 个 潜在 的 遍历 结果 。 碰 撞 评 估 函 数 可 以 确定 这 个 结果 是 否 应 


该 包含 在 遍历 的 结果 中 。 


Side selector 这 个 部 件 确 定 遍 历 在 每 一 侧 应 该 移动 的 多 快 。 交 替 侧 选择 器 是 最 常用 的 ， 它 每 次 一 步 在 移动 起 始 侧 和 结束 侧 


遍历 之 间 做 出 侧 的 选择 。 


起 间 ; 例 | 


和 tI 


图 8-6 ”用 于 查找 两 个 节点 之 间 路 径 的 双向 遍历 


程序 8-9 给 出 了 一 个 使 用 Neo 笑 毅 历 API 实 现 的 双向 遍历 的 例子 。 


【程序 8-9】 ”一 个 社交 网 络 中 查找 两 个 用 户 之 间 路 径 的 双 同 遍历 


BidirectionalTraversalDescription description = 09 切 妈 化 裕 向 这 内 描述 Bidirectio 
Traversal .bidirectionalTraversal{) nalTraversalDescription 
.startsidet 
Traversal .description(}) .relationships (KNOWS) 4 设置 庙 历 描述 的 起 始 和 外 
Uniqueness (Uniqueness .NODE PATH) 为 廊 历 出 的 方向 
.Ends1lide ( 
语 署 廊 历 描 讲 >» Traversal.descriptiont{) .relationships (ENOWS) 
的 结束 侧 为 遍 .uniqueness (Unliqueness .NODE PATH) 
， 
历 进 的 方向 pe | ee 
‘CoOllisionEvaluator (new Evaluator() 1 
override 设置 碰 模 评估 函数 为 包 
i public Evaluation evaluate(lPFath path) 1 i EF 
设置 侧 选择 器 yeturn Evaluation.INCLUDE AND CONTINUE ， 全 找到 的 所 有 宇 反 后 
为 在 两 个 递 历 “各 } ni : 
方向 之 间 交 苦 }) 通过 指定 起 
弯 换 > ,SldeSelector (SideSelectorPolicies,ALTERNATING, 100).; 始 节 点 和 和 妇 
Traverser traverser = description.traverse (USerl, usSer2).; 束 下 夸 开 好 
IteratorcPath» iterator = traversger,iteratort{).: 型 问 遂 历 
while (iterator.hasNext()) 1 以 通常 的 方式 在 
Svestem,out .printlnliterator.next ()); 结果 中 迁 1 代 


| 


要 初始 化 双向 遍历 描述 ， 可 以 使 用 静态 辅助 方法 Traversal.bidirectional Traversal () ， 这 与 正常 遍历 初始 化 相似 (@) 。 
下 一 步 ， 为 遍历 描述 设置 出 的 方向 (@) 。 用 标准 单 向 遍历 API 创 建 BidirectionalTraversalDescription 并 以 NODE_PATH 唯 一 
性 跟随 KNOWS 关 系 。 


步 对 双向 遍历 的 方向 重复 同样 的 过 程 ， 使 用 同样 的 遍历 描述 (全) ， 但 是 注意 ， 没 有 任何 东西 阻止 你 从 进入 方向 使 用 不 
同 的 遍历 (例如 ， 通 过 跟随 不 同 的 关系 ) 。 


再 下 一 步 是 配置 碰撞 评估 函数 ( 信 ) 。 碰 撞 评 估 函 数 是 普通 的 Evaluator 实 现 ， 用 于 确定 当 “ 出 ”遍历 和 “ 进 ”″ 凯 历 碰撞 时 
上 友 生 的 情况 。 你 想 要 的 是 返回 所 有 这 举人 碰撞， 因此 ， 评 估 阔 数 简单 地 返回 Evaluation.INCLUDE AND_CONTINUE 融 可 以 了 。 


建立 BidirectionalTraversalDecription 的 最 后 一 步 是 设置 侧 选择 器 (全 ) ， 负 责 确定 来 自 两 侧 的 遍历 如 何 进行 。 这 里 提供 了 
内 置 的 ALTERNATING 侧 选择 器 ， 这 正 像 它 的 名 字 所 述 ， 在 遍历 方向 之 间 交 蔡 (一 步 在 一 个 方向 ， 而 另 一 步 则 在 相反 的 方向 ) 。 


有 了 这 些 ， 双 向 遍历 就 做 好 了 准备 ， 因 此 可 以 通过 调用 traverse 方 法 并 指定 开始 和 结束 节点 开始 遍历 了 (@) 。 与 往常 一 
样 ， 在 结果 中 迭代 直到 结束 遍历 (@) 。 


你 从 双向 遍历 中 得 到 了 什么 好 处 ? 束 像 我 们 前 面 提 到 的 ， 在 一 个 大 型 图 形 上 做 一 个 标准 单 向 遍历 可 能 会 有 低 于 最 佳 的 性 能 。 
在 这 种 情况 下 通过 使 用 双向 遍历 ， 有 效 地 利用 了 两 个 遍历 去 遍历 图 形 ， 把 问题 的 尺度 降低 了 一 半 。 对 于 经 典 的 单 同 退 历 ， 亿 历 的 
天 系数 量 随 着 遍历 的 深度 成 指数 增长 。 当 使 用 双 同 饥 历 时 ， 每 一 侧 的 通 历 将 只 需要 访问 一 半 的 图 形 深度 ， 做 较 少 的 节点 一 关系 
一 节操 跳跃 ， 从 而 获得 更 好 的 性 能 。 


四 注意 


Neo4j 中 可 用 的 内 置 图 形 算法 ,例如 shortestPath 或 2 图形 搜索 (来自 于 GraphAlgoFactory 类 ) ， 从 Neo4j 1.8 版 本 起 可 以 使 用 双 


向 过 历 。 


并 不 限定 在 一 个 方向 上 只 用 一 个 起 始点 。 双 向 遍历 两 个 方向 上 都 可 以 有 多 个 起 始点 。 要 使 用 这 个 特性 ， 你 必须 使 用 超载 的 


BidirectionalTraversalDescription.traverse 方 法 。 


BidirectionalTraversalDescription.traversel Iterable<Node>» start, 
Iterable<Node» em ) 


所 有 这 些 都 使 得 双向 遍历 成 为 一 个 非常 强大 的 工具 。 用 几 行 代码 ， 可 以 写 出 快速 的 基于 一 些 固定 的 节点 进行 查找 的 遍历 ， 例 
如 ， 查 找 认 识 某 一 给 定 用 户 组 的 所 有 用 户 。 尽 管 进行 双向 遍历 设置 有 一 点 困难 ， 但 它们 具有 更 好 的 性 能 并 且 比 标准 遍历 使 用 较 少 
的 内 存 ， 尤 其 是 对 长 路 径 。 


8.5 ”本 童 小 结 


遍历 是 一 个 查询 图 形 数据 非常 强大 的 方式 ， 在 本 章 中 你 学 习 了 一 些 高 级 概念 和 技术 ， 能 够 帮助 你 写 出 快速 有 效 的 遍历 。 


使 用 正确 的 遍历 顺序 可 以 使 得 一 个 遍历 在 速度 和 内 存 占用 上 有 极 大 的 提高 ， 尤 其 是 对 大 型 图 形 数据 集 。 在 8.1 节 你 看 到 了 沁 
用 的 深度 优先 和 广度 优先 顺 友 策略 对 遍历 效率 的 影响 。 


你 也 学 习 了 关于 关系 扩展 的 关键 概念 ， 了 解 了 一 个 标准 的 实际 扩展 器 适合 于 所 有 典型 的 遍历 使 用 情况 。 但 是 对 一 些 更 特定 的 
场景 ， 我 们 演示 了 如 何 通过 充分 利用 功能 强大 的 Neo4j 灵 活 的 遍历 API， 用 一 个 顺序 扩展 器 排序 关系 和 如 何 实施 自 定义 关系 扩展 


蚁 


访问 过 的 节点 和 关系 的 唯一 性 是 我 们 将 讨论 的 下 一 个 高 级 遍历 课题 。 你 学 习 了 如 何 确保 在 遍历 期 间 访 问 每 一 个 节点 或 关系 仅 
仅 一 次 。 我 们 也 演示 了 如 何 使 用 不 同 的 唯一 性 限制 来 解决 一 些 查询 。 


最 后 ， 你 看 到 了 一 个 很 少 有 人 知道 ， 但 是 Neo4j 的 一 个 强大 功能 : 双向 遍历 。 我 们 实施 了 一 个 从 多 个 点 开始 并 汇集 到 一 点 的 
遍历 ， 大 大 缩短 了 求解 的 时 间 。 


在 本 章 中 我 们 学 习 了 许多 Neo4j 新 的 复杂 概念 和 特点 。 但 是 Neo4j 如 何 与 现在 流行 的 Java 框 架 一 起 工作 ? 是 否 有 一 种 简单 的 方 
式 可 以 用 于 将 图 形 映 射 到 面向 对 象 的 编程 模型 ? 这 正 是 我 们 下 一 章 将 要 学 习 的 内 容 ， 在 那里 讲述 了 最 流行 通用 的 Java 框 架 
(Spring 框 架 ) 和 它们 是 如 何 与 Neo4j 集 成 的 。 


第 9 草 Spring Data Neo4j 


本 章 包 括 以 下 内 容 : 

“ 使 用 Spring Data Neo4j (SDN) 创建 域 模型 
“ 加 载 和 保存 SDN 域 实体 

. 在 SDN 内 以 对 象 -图 形 映 射 模 式 工 作 

用 SDN 做 查询 


到 目前 为 止 ， 我 们 一 直 都 在 直接 使 用 核心 Neo4j 图 元 (节点 和 关系 ) ， 用 不 同 的 域 模型 概念 进行 表示 和 交互 ( 即 读 和 执 
行 ) 。 


尽管 这 种 方法 的 功能 强大 且 极 其 灵活 ， 但 低层 Neo4 API 的 操作 有 时 非常 繁琐 的 ， 并 导致 许多 样板 化 的 代码 ， 尤 其 是 当 遇 到 
一 些 域 模型 实体 时 。 在 本章 中 ， 我 们 将 介绍 Spring Data Neo4 (SDN) ， 这 是 一 个 以 更 简单 、 更 熟悉 为 目标 的 基于 Spring 开 友 
模型 的 Spring Data 项 目 中 的 子 项 目 ， 在 这 种 情况 下 ， 尤 其 是 揭 Neo4j.。 


为 了 演示 39DN ， 我 们 将 返回 到 第 1 章 摘 述 的 并 且 在 本 书 各 章 中 都 使 用 的 第 一 个 允许 用 尸 对 电影 进行 评级 的 社交 网 络 例子 。 我 
们 将 利用 这 个 社交 网 络 演 示 SDN 如 何 允 许 使 用 老式 的 Java 对 象 (POJO) 对 域 进行 建 模 ， 并 且 讲 解 映射 到 低层 图 形 结构 是 如 何 产 
生 的 。 我 们 也 将 演示 如 何 读 、 执 行 和 查询 这 些 管 理 的 实体 。 


9.1 SDN 适合 做 什么 


倘 而 言 之 ，SDN 是 一 个 对 象 -图 形 映射 (OGM) 框架 ,是 为 了 简化 开 友 者 的 工作 而 创建 的 (目前 只 有 Java 具 有 ) ， 或 者 说 
是 满足 那些 需要 或 者 想 要 用 它 与 基于 POJO 域 模型 工作 的 开 友 者 ， 在 这 种 情况 下 ， 所 有 的 数据 都 存储 在 Neo 和 中 。 它 的 目的 是 通 
过 处 理 所 有 低层 工作 和 从 Neo 活 读 域 实体 并 写 回 去 所 必需 的 映射 逻辑 来 提高 效率 。 这 将 使 你 腾 出 时 间 把 重点 放 在 写 代 码 上 一 一 即 
业务 逻辑 。 图 9-1 给 出 了 在 更 广泛 的 应 用 中 适合 SDN 的 场合 . 


Java 应 用 
和 5 
基于 POJO 对 尝 鸭 Ey 蕊 二 re \ 
域 模型 | 后 一 | 
2 
0 
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和 Neo4j APIs 的 顶 评 (SDN) 
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图 9-1 在 更 广泛 的 应 用 中 适合 SDN 的 场合 概况 


在 计算 机 软件 中 ， 从 硬盘 读数 据 和 把 它 转换 为 应 用 程序 专用 的 数据 结构 ， 然 后 再 把 它 写 回 硬盘 是 非 钊 弟 用 的 操作 。 在 早期 的 
Java 天 系数 据 库 管理 系统 中 (Java/RDBMS) ， 许 多 开发 者 手工 开发 他 们 自己 的 持久 性 映射 逻辑 ， 例 如 ， 使 用 低层 框架 如 使 用 
Java 数 据 库 链接 (JDBC) 直接 与 数据 库 交互 以 创建 和 处 理 它们 的 域 对 象 。 这 种 万 法 被 证 明 是 相当 容易 出 错 而 且 在 整个 应 用 程序 
的 开 上 友 过 程 中 会 化 费 大 量 的 时 间 ， 需 要 开 上 及 者 对 每 一 个 新 的 项 目 一 遍 又 一 般 地 做 同样 的 事情 。 其 他 很 多 对 象 -天 系 映 射 框 贸 ， 例 
如 Hibernate (http://hibernate.org/orm) ， 将 一 些 繁 重 的 工作 从 开发 过 程 中 提取 出 来 并 弥补 了 在 物理 存储 结构 与 内 存 中 模型 
的 转换 之 间 的 间 阶 。 


Neo4j 天 生 的 基于 图 形 的 存储 结构 很 目 然 地 提供 了 一 个 比 关 系数 据 库 更 适宜 的 对 复杂 对 象 图 形 的 存储 和 恢复 。 关 系数 据 库 弟 
党 需要 引进 额外 的 数据 结构 ， 例 如 联接 表格 处 理 基 本 的 多 对 多 关系 ; Neo4j 很 擅长 处 理 这 种 情况 。 尽 管 也 会 有 一 些 从 永久 性 仓储 
到 域 对 象 的 数据 转换 ， 但 如 果 低 层 持续 性 技术 是 Neo4j 图 形 数据 库 ， 则 会 用 3DN 来 处 理 。 在 SDN 的 情况 下 ， 这 涉及 映射 节点 和 
天 系 的 目 然 图 形 概念 到 选 定 的 POJO 与 模型 类 。 


对 非 Java 项 目 对 象 -图 形 映射 将 是 什么 情况 ? 


对 于 其 他 的 非 Java 对 象 -图 形 映 射 框架 ， 其 中 的 一 些 可 以 在 http://neo4j.otg/dtivetfs 这 个 网 站 上 找到 (在 普通 的 Neo4j 客 户 端 之 


间 穿 插 ) 。 下 面 列 举 了 一 些 框架 ， 但 是 请 参阅 网 站 上 的 最 新 选项 。 


.neo4j.fb 一 个 包含 Rails Active Model 的 对 象 -图 形 映 射 类 型 实现 的 Ruby 绑 定 和 一 个 Active Record API 的 子 集 ， 参 


见 https:/ /pgithub.comy/ andteastonpge/neo4j。 


* Neo4j Grails 插 件 一 一 一 个 集成 Neo4 图 形 数 据 库 到 Grails 的 插件 ， 提 供 了 一 个 GORM API， 参 


阅 http:/ /grails.org/plugin/neo4]j。 


.heo4djanpgo 一 个 对 Django 的 对 象 -图 形 映 射 ， 请 参考 https://github.com/scholrly/neo4django。 
. neomodel 一 个 对 Python 的 对 象 -图 形 映 射 ， 参 阅 https://github.com/tobinedwards/neomodel。 


9.1.1 什么 是 Spring 以 及 Spring 与 SDN 是 怎样 关联 的 


Spring (http://projects.spring.io/spring-framework) 是 一 个 非常 流行 的 基于 Java 的 应 用 开发 框架 ， 它 为 Java 的 开发 者 
提供 生产 力 工具 和 实用 程序 。 


Spring 本 身 具 有 许多 子 项 目 处 理 不 同 的 领域 ， 其 中 一 个 是 Spring Data。 在 Spring Data 中 ， 其 中 的 项 目 之 一 是 SDN。 
Pivotal (前 身 是 SpringSource) 的 工程 师 认 识 到 有 许多 可 行 的 数据 访问 框架 可 以 用 在 传统 的 关系 数据 库 中 ,但 是 ， 在 NoSQL 的 
全 新 世界 中 却 并 不 多 见 。 


开源 Spring Data 项 目 是 作为 一 个 大 项 目 开发 的 ， 具 有 许多 创建 的 子 项 目 为 指定 的 数据 库 提供 逻辑 〈 其 中 的 第 一 个 是 SDN， 
由 Emil Eifrem 和 Rod Johnson 完 成 的 初始 版 本 ) 。 在 这 一 领域 的 其 他 NoSQL 新 人 包括 MongoDB 和 Redis。 


在 所 有 情况 下 ， 来 自 于 Pivotal 和 低层 数据 库 的 开 友 者 使 这 个 框架 友 展 到 目前 的 情况 。 所 有 的 Spring 数 据 项 目 都 充分 利用 核 
IsSpring 框 以 内 可 使 用 的 现 有 好 的 做 法 和 已 得 到 证 实 的 功能 ， 用 以 提供 它们 的 数据 访问 逻辑 的 特性 。 


9.1.2 SDN 运 合 做 什么 〈 及 不 适合 做 什么 ) 


SDN 从 本 质 上 给 需要 或 期 竺 操作 基于 POJO 的 域 实 体 的 开 友 者 提供 了 一 种 方便 的 使 用 代码 或 库 函 数 的 方法 。 如 果 是 早已 经 使 


用 spring， 或 早已 经 在 使 用 丰富 领域 模型 并 想 映 射 到 一 个 图 形 数据 库 ，SDN 正 适合 于 做 这 样 的 工作 。 


除 已 经 或 想 要 使 用 其 工作 ， 对 于 丰富 领域 模型 ， 另 一 个 需要 重点 考虑 SDN 的 因素 是 通常 要 处 理 的 结果 或 实体 的 性 质 和 数 
量 。 如 果 是 在 几 百 到 几 干 的 学 围 内 ， 在 这 种 情况 下 ， 它 本 身 可 以 很 好 地 进行 设置 。SDN 不 适合 一 次 处 理 任意 类 型 的 大 量 数据 的 
场景 。 要 加 载 或 存储 的 任何 逻辑 在 一 次 操作 中 超过 10000 个 单元 对 9DN 来 说 不 是 一 个 好 的 选择 。 另 外 ， 通 过 提供 了 一 个 间接 
层 ，SDN 会 比 仅仅 使 用 核心 API 慢 ， 因 此 ， 如 果 速 度 和 性 能 是 考虑 的 最 重要 因素 的 话 ， 最 好 还 是 使 用 其 本 身 的 APl。 


四 注意 


SDN 框 架 提 供 了 许多 工具 (提供 访问 低层 GraphDatabaseService 实 例 的 代码 ) ， 可 以 使 用 低层 核心 API 获 得 最 佳 的 性 能 和 最 大 
的 灵活 性 。 你 仍然 可 以 使 用 标准 的 Neo4j 工 具 查 看 、 查 询 和 (在 一 定 的 限制 内 ) 更 新 SDN 外 的 图 形 数 据 。 本 草 的 后 面 提供 了 一 些 
有 关 该 课题 的 更 多 资料 。 


9.1.3 ”从 哪里 获得 SDN 


SDN 并 不 包含 在 主 Neo 锋 中， 但 是 可 以 以 单独 的 库 下 载 并 与 合适 版 本 的 Neo 儿 配合 使 用 。 在 程序 的 编写 时 | 间 ， 最 新 的 可 用 版 
本 是 3.2.1， 与 Neo4j 2.1.5 版 兼容 ， 可 以 在 http://projects.spring.io/spring-data-neo4j 下 载 。 本 章 (和 随同 的 程序 代码 ) 将 会 
使 用 这 个 版 本 。 附 录 C 提 供 了 更 详细 的 如 何 设置 工程 以 便 使 用 SDN 的 说 明 。 更 多 有 天 介绍 SDN 3 忆 体 重大 变化 的 资料 请 参 
疝 http://blog.neo4j.org/2014/03/spring-data-neo4j-progress-update-sdn-3.html 上 的 Neo4j 博 客 帖 子 “Spring Data 
Neo4j 的 进展 与 更 新 : SDN 3 与 Neo4j 2” 。 


9.1.4 ”从 哪里 获得 更 多 的 信息 


SDN 本 身 是 一 个 巨大 的 项 目 ， 我 们 到 目前 也 仪 仪 能 够 了 解 这 些 。 在 本 章 中 ， 我 们 把 目标 放 在 提供 框 腑 中 一 些 比较 重要 的 方 
面 进行 介绍 而 不 是 一 个 全 面 的 参考 指南 。 如 果 你 想 查 找 更 深入 的 在 这 里 涉及 以 及 没有 涉及 的 某 一 方面 的 人 资料， 有 许多 这 方面 的 好 
书 , 例如 Michael Hunger 的 《Good Relationships》， 同 时 已 经 被 编 入 官方 的 SDN 参 考 文档 ， 可 以 在 这 里 找 
到 : http://docs.spring.io/spring-data/neo4j/docs/current/reference/html/ (在 这 里 www.infoq.com/minibooks/good- 
relationships-spring-data 免 费 下 载 ) 和 Mark Pollak 的 《Spring Data》 与 其 他 的 书籍 。 总 体 来 说 ，SDN 的 文档 
(http://projects.spring.io/spring-data-neo4) 也 是 一 个 非常 有 用 的 参考 资源 ， 拥 有 有 关 核 心 Spring 框 架 的 更 党 用 的 信息 ， 
可 以 在 http://projects.spring.io/spring-framework 阅 读 。 


9.2 用 SDN 建 模 


在 本 节 中 ， 我 们 将 介绍 如 何 使 用 SDN 把 POJO 转 换 成 在 电影 爱好 者 社交 网 络 中 代表 的 实体 ， 这 里 的 数据 存储 在 Neo4j 数 据 库 
中 。 我 们 假设 都 是 从 空 日 的 画布 开始 并 且 将 使 用 SDN 作 为 主要 的 驱动 、 创 建 和 设置 图 形 数据 库 的 机 制 。 如 果 你 早已 经 有 了 一 个 
图 形 数据 库 并 且 想 知道 是 否 能 用 SDN， 请 参阅 本 章 后 面 的 内 容 。 


在 本 证 中 ， 你 将 做 以 下 事情 : 
1) 定义 一 个 标准 的 POJO 对 象 模型 代表 域 。 


2) 了 解 由 SDN 把 这 些 POJO 转 换 成 Neo 御 支持 的 实体 的 需求 。 


3) 稍微 深入 一 些 看 看 SDN 建 模 的 不 同 元 素 ， 包 括 : @ 建 模 节 点 实体 。@ 建 模 天 系 实体 。@ 建 模 节 操 之 间 的 关系 实 体 。 


重新 回顾 一 下 ， 在 这 个 社交 网 络 中 ， 用 户 之 间 可 以 互 为 朋友 。 用 尸 也 可 以 标识 他 们 看 过 的 电影 并 根据 对 电影 的 喜欢 程度 给 它 
们 评 为 1~5 个 星 。 你 将 给 用 户 添加 一 个 userld 属 性 ， 因 此 用 户 可 以 登录 。 这 也 会 使 你 唯一 标识 和 指定 每 一 个 用 户 。 最 后 ， 你 将 为 
新 用 户 添 加 权力 以 表示 他 们 是 否 能 在 登录 的 时 间 被 其 他 的 用 尸 引 用 。 这 可 以 用 作 推 荐 者 给 新 成 员 在 第 一 个 月 评价 的 每 部 电影 的 分 
配 积 分 点 ， 可 能 获得 一 张 免费 电影 票 或 其 他 福利 。 图 9-2 展 示 了 因为 通过 David 的 推荐 ，John 最 初 加 入 了 网 络 。 


vpe: User 


+ 
name: David Alpha s 
| userld: david001 pa 


> 


referredhy 


r- 一 -一 一 二 上 
tvype: User 


name* JOohn Johnsaon 
| userld: Johno0l pa 


LL 


type: User 


name:* Kate Smith 
USerld: kate00l 


E ~- -一 


/ \ 
| \ 
/ 
/ \ 

HAS SEEN | \ HAS SEEN 
号 - 巧 妨 工 号 = | A SrESe 也 
| 1 
1/ \ 

/ HAS SEEN 2 \ HAS_SEEN \ 
| stars: 4 /A \ stars: 5 \ 
| ' \ 

四 1 _ 1 


iy 
i 


name: Heat 


type: Mavie 


| name: Alien 
| type: Movie 


name: Fargo 


type: Movie 


图 9-2 ”具有 推荐 者 的 电影 爱好 者 社交 网 络 的 概念 性 概述 


9.2.1 原始 POJO 域 建 模 


如 果 忽 视 数 据 实 际 上 是 储存 Neo4j 中 的 事实 并 且 只 想 简 单 地 党 试 以 POJO 建 模 你 的 概念 领域 ， 则 你 的 第 一 个 党 试 将 会 如 程序 
9-1 所 示 。 注 意 ， 为 了 简单 省 去 了 getter 和 和 setter 方 法 。 


【程序 9-1】 ”原始 POJO 建 模 尝 试 


String niame 


8 3 
i F 
| 加 -PE 本 一 中 | ] 站 -下 i rT ' 
SeEtcle 本 的 生 络 评定 ) 
Set<Viewing»> Viewes; 


Setelsgers friendes 
User refterredByv.; i 
Do 推荐 用 户 到 该 系统 的 用 户 


public class Movie | 
String title; 
Set<Viewing> Views; Ta 产 ( 纵 出 


public class User 1 有 用 户 的 朋友 
String userlId:; a a ns 
所 和 有 有 电影 蒜 房 ( 其 有 用 户 给 是 


了 星 级 评定 ) 
DUublic class Viewingd 1 
USser USer; 


ee 用 户 给 入 六 电影 的 评 氏 (1 
MOYV1lEe MOV1leE; Eh 


Integer Stars.,; 


ETI] 


Mg 


这 里 并 没有 什么 特别 复杂 的 代码 一 一 这 是 基本 的 对 象 建 模 。User 和 Movie 概 念 都 被 建 模 成 第 一 类 的 实体 ， 这 看 上 去 非常 合 
理 。 你 也 将 用 户 观 看 一 部 特定 的 电影 建 模 成 一 个 实体 ， 即 Viewing 类 。 这 主要 是 因为 关系 本 身 具 有 很 重要 的 想 要 保留 和 使 用 的 信 
恩 一 一 即 用 户 给 定 的 评级 stars。 如 果 将 这 个 建 模 成 简单 的 User 和 Movie 之 间 的 连接 类 关系 ， 则 将 丢失 这 些 信 息 。 


在 这 一 点 上 ， 还 没有 引用 任何 的 SDN 或 Neo4j 特 定 的 概念 ， 只 是 POJO 的 内 容 。 下 一 步 ， 我 们 将 需要 把 这 些 实体 映射 到 低层 
Neo4j 图 形 模 型 。 

现在 距离 创建 容易 翻译 成 Neo4j 领 域 的 POJO 模 型 有 多 接近 了 ?” 可 以 不 修改 就 使 用 它 或 者 需要 对 它 做 修改 吗 ?在 这 一 特定 的 
情况 下 ， 你 似乎 有 一 个 不 错 的 选择 ， 将 User 和 Movie 类 分 别 整 洁 地 以 相关 的 name 和 title 属 性 映射 到 Neo4 节 点 图 元 概念 。 


新 的 referredBy 关 系 (@) 代表 了 推荐 用 户 的 一 个 推荐 者 ， 而 IS_FRIEND_OF 是 用 户 与 一 组 朋友 之 间 恰 当 映 射 的 关系 (外 
) 。 唯 一 棘手 的 部 分 似乎 是 围绕 着 Viewing 类 的 建 模 ， 它 将 试图 代表 一 个 用 户 看 过 一 部 电影 和 可 选 的 给 予 评价 的 情况 。 然 而 ， 进 
一 步 的 检查 显示 这 也 非常 适合 Neo4j 的 关系 概念 。Viewing 类 代表 了 具有 选项 stars 属 性 的 HAS_SEEN 关 系 ， 以 及 看 过 这 部 电影 的 
User 和 Movie 本 身 的 引用 。 


到 目前 为 止 ， 一 切 都 很 好 。 现 在 该 进行 SDN 了 映射 了 。 
全 注意 
不 可 能 总 会 找到 一 个 逻辑 POJO 模 型 与 Neo4j 物 理 结 构 非 常 接近 。 如 果 有 ， 那 是 非常 幸运 的 ， 但 是 在 其 他 情况 下 ， 有 可 能 要 修 
改 模 型 以 适应 Neo4j 的 物理 结构 。 在 任何 情况 下 ， 逻 辑 模型 强调 的 重点 是 如 何 将 通用 的 POJO 建 模 概念 转换 成 Neo4j 结 构 。 
SDN 建 模 的 挑战 


在 本 章 中 我 们 使 用 的 逻辑 模型 碰巧 可 以 很 容易 地 转换 成 Neo4j 物 理 存储 结构 而 不 需要 进行 过 多 的 调节 。 有 必要 强调 有 两 种 情 
况 可 能 需要 微量 调整 的 对 象 模 型 来 满足 一 些 SDN 了 映射 的 需求 。 


` 使 用 基于 非 设置 集合 一 一 当 建 模 节 点 实体 关系 时 〈 通 过 @RelatedIo， 将 在 9.2.5 节 介绍 ) ， 现 在 只 能 使 用 基于 设置 的 集合 
例如 ， 不 能 使 用 以 下 的 代码 : 


RelatedTo 
private Map<cRelationshipType,Set<Users> USEerSs; 


v1 等 小 


部 分 对 象 的 标识 。 引 自 参 考 指南 “实体 平等 是 一 个 灰色 地 
带 ， 并 且 是 否 是 自然 键 还 是 数据 库 编号 最 好 的 描述 了 平等 性 还 是 有 争议 的 ， 还 有 随 着 时 间 的 版 本 问题 等 ”。 我 们 已 经 采用 了 
Spring Data Neo4j 数 据 库 产生 编号 的 传统 方法 是 平等 性 的 基础 ， 并 且 这 也 会 有 一 些 后 果 。 有 一 些 技术 以 应 对 这 种 场景 ,但 是 本 书 
中 不 涉及 这 些 问题 的 内 容 。 我 们 再 一 次 向 你 推荐 官方 网 站 参阅 更 多 的 信息 ， 地 址 是 http://docs.spting.io/spting- 


data/neo4j/docs/current/reference/html。 


9.2.2 ”注释 域 模型 
SDN 是 一 个 基于 注释 的 对 象 -图 形 映射 库 。 这 意味 看 这 是 一 个 依赖 于 能 识别 一 些 附 人 在 你 的 程序 中 的 SDN 专 用 注释 库 。 这 些 注 


释 提 供 了 如 何 转换 相关 的 代码 到 图 形 数据 库 低层 结构 的 指导 。 


有 时 你 甚至 会 发 现 不 需要 注释 程序 的 某 个 片段 。 这 是 因为 SDN 试 图 使 用 设置 中 的 一 些 传 统 原理 推理 一 些 有 意义 的 默认 设 
置 。OGM 对 图 形 数据 库 束 像 ORM 对 关系 数据 库 一 样 。 


程序 9-2 给 出 了 Neo4j 支 持 的 添加 到 POJO 中 作为 实体 识别 它们 的 SDN 注 释 。 


【程序 9-2】 ”SDN 注释 的 域 模型 


BNModeEntity 全 | Neo4i 节点 图 
public class User 1 


String name:; 
EIndexed (unique=true) 
String userIld:; 


在 图 形 肉 以 节点 属性 鱼 褒 


四 rapnId 
Londg nodeld:; 


User reterredBy; 

@RelatedTo (type = "IS FRIEND OF", direction = Direction.BOTH) 
Set<User> friends.: 

久 RelatedToVia 

Set<Viewing»> Viewas:; 


| 
生生 = 这 不 后 吾 
BNodeEntity 在 图 还 内 以 ed 
NeO4] | public class Movie 1 半点 遇 性 屡 在 怕 多 的 其 他 
入 点 国 基 占 字 司 半 概 
String title; 后 壬 售 关系 
Long nodeld:; 
RelatedToVvialdirecticon = Direction,.INCOMING) 
Iterable<Viewing> Views; 
b 
> @RelationshipEntity (type = "HAS SEEN") 
NeG4] i | | 
] public class Viewing 1 CH Ee 
关系 图 在 图 形 内 以 其 系 属性 鳃 下 
Integer stars.; < 
®GraphId Neo41 关系 编号 
Long relationsniplId; 
StartNode 
User UsSer:; 关系 男 一 访 节 击 
ee 实体 的 引用 


Movie movie,. 


这 些 注释 ， 包 括 SDN 合 理 的 基于 字段 名 的 默认 假设 ， 直 接连 接着 java 类 元 素 和 Neo 笑 中 的 物理 实体 。 这 意味 着 当 用 SDN 建 
模 时 对 数据 异型 有 一 个 很 好 的 理解 是 非常 重要 的 。 尽 管 SDN 不 需要 你 必须 做 低层 的 映射 ， 但 是 期 待 你 能 够 描述 它 是 如 何 做 的 。 


接 下 来 的 一 忆 将 分 解 程 序 9-2 并 解释 核心 建 模 概念 ， 更 详细 内 容 如 下 。 


` 建 模 关系 实体 。 
“ 建 模 节点 实体 之 间 的 关系 。 


我 们 从 节操 实体 开始 。 


9.2.3 ” 建 模 世 点 实体 


在 SDN 内 ,一 个 节点 实体 是 撒 一 个 Java 类 ， 用 于 代表 一 个 特定 的 域 实体 ， 该 实体 是 低层 数据 库 中 由 一 个 Neo 笑 节点 元 支持 和 
代表 的 。 图 9-3 显 示 了 社交 网 络 域 模型 中 的 能 够 被 建 模 成 SDN 书 点 实体 的 候选 节点。 


这 里 Movie 和 User 类 是 非常 完美 的 例子 。 使 用 @NodeEntity 注 释 标 记 一 个 节 扣 实 体 ， 一 般 放 在 Java 类 定义 之 前 ， 如 程序 9-2 
和 下 面 的 程序 所 示 。 


1. 属 性 


在 用 @NodeEntity 注 释 的 类 中 ， 在 默认 的 情况 下 SDN 将 把 所 有 的 简单 字段 作为 后 备 节 点 上 的 Neo4j 属 性 的 代表 。 在 文字 
上 ， 简 单 是 指 : 


IS FRIEND OF 


names: 可 局 村 下 Jonnson 


区 
~” HAS SEEN 


bs Starss: 4 \ Stars 


name*: Alien 


David Alpha name: Fargo 


User type: Movie type: Movie 


Neo4j 节操 public class User 1 对， 局 F， : 
支社 的 匡 写 上 二 1 Ti 本 [ti 已 : ra A 用 得 如 睫 Ll 8 中 i 
ame | bi 绷 你 用 户 编 号 节 挟 被 案 引 (使用 基于 模式 的 


Indexed (unidque=true) 

String userId,; 

@GraphId | 和 包车 Neod 和 下 所 山王 的 
”属性 


LOng nodeld.; 
` 任何 原始 的 或 与 它 相 关 的 封装 类 。 


` 通过 Spring 传统 服务 能 够 被 转换 成 字符 串 的 一 个 对 象 。 


这 些 类 型 的 任何 集合 也 包括 在 内 ， 这 些 集合 最 终 作 为 数组 人 存 到 Neo4j 节 点 上 。 在 前 面 的 例子 中 ， 这 意味 着 分 别 定 义 在 User 和 
Movie 类 上 的 name (人 @) 和 title 字 段 将 作为 Neo4j 属 性 获得 与 那些 相同 名 字 的 映射 ， 而 不 需要 你 做 任何 工作 。 
自 定义 属性 类 型 是 什么 情 ) 
核心 Spting 框 架 附 带 一 个 通用 类 型 转换 系统 允许 你 编写 和 注册 自 定 义 类 型 转换 逻辑 ， 该 逻辑 可 以 转换 指定 的 〈 非 元 ) 类 到 一 
个 字符 串 描 述 ， 或 者 反 过 来 也 可 以 。SDN 早 已 经 注册 了 一 些 转 换 服 务 以 处 理 枚 举 和 日 期 类 。 人 例如， 如果 在 一 个 节点 实体 上 定义 一 
个 javautil.Date 字 段 ， 当 这 个 字段 在 存储 的 时 候 ，Spting 发 现 有 一 个 目 定 义 的 日 期 转换 器 并 使 用 它 转 换 日 期 属性 到 一 个 字符 串 ， 然 
后 存 到 图 形 数据 库 中 ; 相反 的 情况 发 生 在 从 图 形 数 据 库 中 读 日 期 时 ， 又 转换 成 节点 实体 字段 。 


这 意味 着 你 可 以 利用 同样 的 机 制 处 理 你 想 用 的 任何 自 定义 类 ， 例 如 电话 号 码 对 象 。 你 将 会 需要 写 一 个 自 定义 转换 器 并 在 
Spring 注 册 。 本 书 的 样本 代码 提供 了 一 个 如 何 通 过 给 User 实 体 添加 一 个 phoneNumber 的 例子 。 更 多 关于 转换 机 制 信 息 ， 请 参阅 
《Spring Framenort Reference》 的 第 6 章 ，http://static.sptingsource.org/spring/docs/current/spting-framework- 


reference/html/validation.html#core-convert。 


如 果 不 注册 一 个 转换 器 ，SDN 仍 会 在 数据 库 中 存储 一 个 字符 串 版 本 的 对 象 。 然 而 ， 这 将 简单 地 依赖 于 从 toStting〈) 方法 中 


返回 的 是 什么 内 容 。 


你 可 能 已 经 注意 到 一 个 额外 的 字段 混 进 了 User 和 M ovie 世 点 实体 ， 也 融 是 nodeld， 由 @Graphld 注 释 的 。 当 使 用 简单 对 象 
映射 时 ， 这 是 一 个 强制 性 的 SPDN 需 求 。 现 在 还 不 需要 了 解 太 深 ， 简 单 对 象 映 射 是 SND 使 用 的 实施 域 实 体 与 Neo4j 广 持 的 图 形 实 


体 之 间 的 物理 映 尉 的 策略 之 一 。 使 用 这 种 策略 ，SDN 需 要 一 个 可 以 用 于 存储 低层 支撑 实体 的 节点 编号 的 字段 。@Graphld 注 释 
(从 ) 用 于 标记 留 出 来 给 SDN 用 于 存储 这 个 值 用 的 字段 。 在 第 9.4.1 节 可 以 读 到 更 多 有 关 简单 对 象 映射 的 内 容 。 


2. 索 引 属 性 


由 于 一 般 认为 对 于 一 个 应 用 程序 依赖 于 Neo 锋 古 点 编号 作为 一 个 对 象 的 外 部 唯一 标识 待 不 是 一 个 好 的 习惯 (参阅 5.6.1 节 ) ， 
有 另外 一 些 查 找 节 点 的 方法 是 很 重要 的 。 前 面 程序 中 的 userld 字 段 添 加 @1ndexed 注 释 以 确保 查找 和 查询 能 够 相对 于 这 个 用 户 并 
基于 这 个 节点 进行 。 默 认 的 情况 下 ，@Indexed 使 用 依赖 于 Neo4j 标 签 的 基于 模式 索引 。 碍 找 实体 的 代码 将 会 在 9.3 节 讲解 ， 但 
是 Neo4j 内 部 使 用 与 3.5.1 节 中 完全 相同 的 模式 索引 代码 和 逻辑 来 实现 。 


申 注 意 
如 果 你 还 是 喜欢 使 用 传统 的 索引 ， 可 以 使 用 indexType 属 性 指定 ， ，@Indexed (indexType=IndexType.SIMPLE) 。 
对 这 些 注释 属性 的 哪些 标 尝 和 名 字 索 引 


默认 情况 下 ，SDN 使 用 一 个 基于 标签 类 型 的 描述 策略 策略 关联 一 个 实体 层级 结构 中 (这 里 是 User) 具有 名 字 为 简单 版 


外 
本 名 字 类 标签 的 节点 实体 的 低层 节点 。 然 后 ， 对 这 个 标签 定义 的 属性 名 字 的 模式 索引 就 创建 起 来 了 。 


如 果 想 要 写 一 些 Cyphet 查 询 直 接 在 图 形 中 的 usetId 属 性 上 进行 查找 ， 你 需要 以 下 的 查询 : 


MATCH (Ini:User) WHERE ni.WUsSerld = | 记名 华工 | da} return n 

注意 如 何 命名 和 建立 域 实体 结构 。 由 于 默认 索引 的 性 质 ， 通 常 不 建议 两 个 实体 具有 相同 的 名 字 ， 即 使 它们 俩 在 不 同 的 包 里 。 
如 果 在 cofe 包 里 有 一 个 Uset 域 实体 ， 另 一 个 在 admin 包 里 ， 他 们 最 终 会 共享 相同 的 标签 ， 这 通常 不 会 是 你 想 要 的 。 通 过 对 这 个 类 设 
置 一 个 @Alias 注 释 ， 有 可 能 窗 盖 这 一 默认 行为 。 然 而 ， 对 那些 没有 注意 到 这 种 行为 的 人 可 能 是 一 种 困惑 ， 可 能 会 导致 意 想 不 到 的 
2 


3. 对 其 他 节操 实 体 的 关系 
节操 实体 之 间 也 有 关系 。 这 些 实体 上 作为 参考 字段 的 简 蛙 映射 ， 将 会 在 9.2.5 忆 介绍 。 
在 我 们 详细 了 解 这 能 做 什么 之 前 ， 你 需要 学 习 天 系 实体 。 
9.2.4 ” 建 模 关 系 实体 
天 系 实体 是 一 个 节操 实体 的 关系 版 本 。 它 是 指 最 终 由 一 个 低层 数据 库 中 的 Neo 笑 关系 代表 和 支持 的 Java 类 。Neo 泊 将 天 系 作 


为 第 一 类 公民 ， 器 像 节 点 一 样 ， 可 以 拥有 它们 目 己 的 标识 待 ， 如 果 需 要 可 以 设置 属性 。 因 此 ，SDN 也 允许 将 它们 表示 为 实体 拥 
有 它们 自己 的 权利 。 图 9-4 显 示 了 域 模型 内 的 这 些 天 系 。 


names: John Johnson 


tvpe: User 和 


referredBy 


name: David Alpha name: Fargo name: Alien 
tvyvpe: User type: Movie type: Movie 
a | 


图 9-4 具有 潜在 能 够 建 模 成 关系 实体 的 加 粗 关系 显示 的 社交 网 络 模型 


在 本 节 中 ， 我 们 将 讨论 作为 一 个 POJO 本 身 建 模 的 具体 Neo4j 关 系 实体 的 需求 。 在 9.2.5 节 中 ， 我 们 将 给 出 从 节点 实体 的 角度 
通过 这 些 模型 关系 以 及 通过 更 入 单 的 机 制 引 用 其 他 节点 实体 的 需求 。 


全 注意 
在 Neo4j 具 体 模 型 中 ， 你 或 许 定 义 了 很 多 关系 ， 但 是 这 不 会 自动 意味 着 它们 当中 的 所 有 都 需要 在 SDN 中 建 模 为 关系 实体 。 


SDN 关 系 实体 一 般 只 在 具有 目 己 的 属性 设置 天 系 中 是 需要 的 ， 并 且 与 这 些 关 系 一 起 ， 提 供 了 上 下 文联 系 的 关系 。 我 们 将 称 
这 些 关 系 为 丰富 关系 (rich relationship) ， 这 是 由 于 它们 包含 着 超出 了 关系 类 型 的 额外 数据 。 


HAS_SEEN 关 系 是 这 种 关系 的 一 个 很 好 的 例子 ， 具 有 额外 的 stars 属 性 提供 了 这 个 关系 的 更 多 内 涵 。 它 表示 了 不 仅仅 是 用 户 
看 过 这 部 电影 ， 而 且 还 表示 了 用 尸 对 它 的 评级 。 在 这 个 社交 网 络 模型 中 ， 这 个 关系 与 它 相 关 的 信息 被 定义 为 Viewing 类 ， 如 程序 
9-3 所 示 。 与 之 对 比 的 是 |S_FRIEND_OF 关 系 ， 对 于 它 所 有 需要 理解 的 是 两 个 用 户 之 间 的 关系 一 一 即 他 们 是 朋友 。 这 些 简单 的 关 
系 ( 这 里 的 类 TYPE 单 独 就 足以 完全 描述 这 个 关系 ， 例 如 IS_ FRIEND_OF 关 系 ) 也 能 够 被 引用 ， 你 将 在 9.2.5 节 中 看 到 这 是 如 何 实 
现 的 ， 但 是 定义 一 个 全 新 的 类 来 代表 它们 并 没有 额外 的 好 处 。 


【程序 9-3】 ”作为 一 个 关系 实体 的 Viewing 类 


@RelationshipEntity (type = "HAS SEEN") < 
public class Viewing f ] Neo4] 关系 支持 的 类 
的 


属性 


GraphId [1 世 售 Neo 和 其 系 编号 的 
Long relationshipId; 

StartNode 
User USer.; 


2 革 芭 开始 的 用 户 市 点 ( 基 系 出 ) 


@EndNode 才 关系 结束 的 电影 节点 (关系 进 ) 
MOVvie mew1e ; 
Integqer stargss < 易 层 关系 上 的 

姓 级 属性 映射 


@ RelationshipEntity 注 释 应 用 于 类 表示 它 代 表 一 个 Neo4j 关 系 。 注 释 取 一 个 type 属 性 表示 数据 库 内 本 身 使 用 的 Neo4j 关 系 
类 的 名 字 。 如 果 这 个 type 属 性 不 是 在 注释 内 显 式 指定 的 ，SDN 会 默认 将 简单 类 的 名 字 指 定 给 它 (在 本 例子 中 是 Viewing) 。 对 于 
节点 实体 ， 一 个 @Graphld 注 释 字 段 的 关系 实体 具有 相同 的 需求 (人 @@) ， 这 次 存储 的 是 低层 关系 的 ID。 


如 果 你 想 访 问 这 个 关系 实体 上 的 任何 一 端的 节点 实体 ， 你 将 会 需要 提供 这 些 节点 中 的 每 一 个 节点 的 一 个 字段 并 且 用 
@StartNode (@@) 和 @EndNode (全 ) 注释 它们 。 对 于 Viewing 类 的 例子 ， 关 系 从 User 节 点 实体 开始 (具有 出 的 关系 ) 到 
Movie 实 体 结 束 。 


束 一 个 Neo4j 关 系 建 模 的 需求 而 言 ， 这 束 是 它 的 需求 。 然 而 ,一 般 来 说 在 定义 隔离 中 的 天 系 实体 类 时 没有 多 少 需 要 注意 的 地 
方 。 它 们 几乎 总 是 指 相 关节 点 实体 上 的 一 个 或 多 个 字段 。 在 9.2.5 节 中 ， 我 们 将 详细 讨论 节点 实体 如 何 通 过 简单 引用 来 引用 其 他 
证 点 实体 ， 但 是 也 可 以 通过 POJO 建 模 的 关系 引用 。 为 了 提供 这 个 例子 的 详细 情况 ， 程 序 9-4 提 供 了 一 个 先睹为快 的 User 节 点 实 
体 以 及 Movie 节 点 实体 如 何 通过 它们 的 views 字 段 引 用 Viewing 关 系 实体 类 的 代码 实例 。 


【程序 9-4】 User 和 Movie 节 点 实体 程序 节选 


BNodeEntity 
public class User | 
@RelatedToVia @@ 所 有 HAS_SEEN 关系 组 


Set<Viewling> Viewe; (从 TUser 的 出 度 ) 


BNodeEntity 

public class Movie | 只 该 所 有 有 
RelatedTovVvia (direction = Direction.INCOMING) 
Iterable<Viewingdg> VIewes:; 


Fr = 
HAS _SEEN 区 系 组 
| 


(从 Movie 的 册 度 ) 


在 User 节 点 实体 内 ， 在 views 字 段 的 RelatedToVia 注 释 (人 @) 实质 上 读 到 了 作为 “这 个 用 户 与 这 个 用 户 看 过 的 任意 电影 之 间 
的 所 有 HAS_SEEN 关 系 (具有 任意 相关 的 属性 ) ” (这 个 HAS_SEEN 关 系 类 型 是 推断 的 ， 因 为 Viewing 类 注释 本 身 的 属性 类 型 定 
义 所 包含 的 内 容 ) 。Viewing 类 代表 这 两 个 包括 评级 字段 的 实体 之 间 的 关系 的 全 部 内 容 。 注 意 在 这 种 情况 下 (不 像 下 一 节 详 细 讲 
述 的 Movie 类 ) ， 你 不 用 在 注释 内 显 式 指定 direction= Direction.OUTGOING ， 因 为 这 是 默认 的 。 


在 Movie 节 点 实体 内 ，RelatedToVia 注 释 (四 ) 标志 views 字 段 作 为 “这 部 电影 和 任意 看 过 这 部 电影 的 用 户 之 间 的 所 有 
HAS _ SEEN 关系 的 代表 (具有 任意 相关 的 属性 ) ”。 


在 两 种 情况 下 Viewing 类 都 提供 了 一 种 对 关系 访问 额外 上 下 文 信息 的 方式 ， 在 这 种 情况 下 ， 事 实 上 这 两 类 实体 仅仅 是 相关 ， 
额外 的 上 下 文 信息 是 每 一 次 观看 所 指定 的 评级 。 在 这 一 阶段 你 可 能 会 惊奇 为 什么 在 一 种 情况 下 关系 会 用 一 个 Set (对 User) 建 模 
而 另 一 种 情况 (对 Movie) 是 用 一 个 lterable 建 模 。 所 有 的 这 些 都 将 在 下 一 节 中 讲解 。 


在 下 一 节 中 ， 我们 将 继续 评 细 探讨 定义 节点 实体 之 间 的 不 同 关 系 类 型 的 细 三 ， 包 括 完全 理解 其 内 容 所 需要 的 丰富 天 系 的 详细 
解释 。 
9.2.5 ” 建 模 古 吕 实体 之 间 的 关系 


到 目前 为 止 你 仅 仪 能够 建 模具 有 隔离 中 的 简单 相关 属性 的 节点 和 关系 实体 。 当 你 能 够 实际 上 连接 它们 用 以 探索 它们 之 间 的 关 
系 时 ， 模 型 束 开 始 变 得 有 趣 了 。 在 本 书 中 ， 我 们 将 讨论 如 何 做 这 些 。 


上 一 节 的 结尾 给 出 了 一 个 如 何 通过 Viewing 天 系 实体 建立 一 个 User 和 Movie 之 间 的 这 样 一 个 连接 的 简单 示例 。 看 到 User 和 
Movie 之 间 的 HAS_SEEN 关 系 是 如 何 作为 一 个 具体 POJO (Viewing 类 ) 建 模 并 在 实体 内 馈 引 用 的 。 在 这 种 特殊 的 情况 下 ， 使 用 
一 个 完全 分 离 的 类 (Viewing) 来 代表 关系 。 但 是 其 他 的 简单 关系 将 会 怎样 ? 例如 “John 是 Jack 的 朋友 ”。 对 这 种 情况 是 否 
需要 一 个 专用 的 天 系 实体 类 ”答案 是 不 需要 一 一 它们 可 以 用 一 个 更 简单 的 方法 来 处 理 。 


图 9-5 概 括 了 你 可 能 从 其 他 书 点 实体 感 兴趣 引用 的 节操 实体 之 间 的 关系 。 


name: John Johnsaon name*: Jack 


tvype: User 


HAS SEEN 


= 二 


HAS SEEN 


Blige “ll 


referredBy 


name: Alien 
type: Movie 


name: David Alpha name: Fardgo 
tvpe: User type: Movie 
了 . . 


图 9-5 ”具有 加 粗 显示 的 节点 之 间 引 用 关系 的 一 个 社交 网 络 模 型 


em 


从 节点 实体 的 角度 看 ， 关 系 也 是 被 建 模 成 普通 Java 对 象 引 用 ， 它 们 有 很 多 的 种 类 ， 取 决 于 你 想 传 达 的 是 什么 。 我 们 已 经 预览 
了 如 何 使 用 Viewing 类 引用 HAS _ SEEN 关系 ， 但 是 也 让 我 们 抓 住 其 他 更 简单 的 关系 ， 例 如 referredBy 和 1IS FRIEND OF。 


涉及 User 和 Movie 实 体 的 关系 显示 在 程序 9-5 中 。 


【程序 9-5】 User 和 Movie 节 点 实体 程序 节选 


ui 二 5 区 一 靖 
请 过 referredBy Public clases User 1 有 
关系 与 这 小 节操 Es lser referredBy:; FRIEND OF 
相 美 的 用 户 人 ( 鞍 BRelatedTIo (type = "IS FRIEND OF", direction = Direction.BOTH) 交际 与 这 
点 实体 】 Set<Users friends:; 节点 相 
BRelatedToVvia 3 用 户 和 电影 之 间 的 HAS_SEEN E 岳 用 请 
Set<Viewings Views; 省 鞭 受 性 向 a 
P= i a I I I er 
| 可 1 EE ) 
public class Movie 1 [4 ) 该 部 电影 和 妆 予 评级 的 用 户 之 
@RelatedToVviatltdiraction = Direction.INCOMING) | 间 的 HAS SEEMN 关系 信息 的 
lterable<VlieWwindg> VieEWE; 只 读 版 本 


由 低层 没有 相关 属性 或 不 与 任何 其 他 节 扣 实体 相关 的 Neo 笑 天 系 代表 的 基本 关系 ， 能 够 在 节操 实体 内 被 建 模 成 标准 的 对 象 引 
用 。 在 默认 的 情况 下 ， 将 会 使 用 属性 的 名 字 作 为 名 字 人 在 Neo4j 中 映射 到 关系 类 ， 在 没有 任何 元 信息 的 情况 下 则 会 相反 。 新 引进 的 
一 个 用 户 引用 另 一 个 的 概念 到 社交 网 络 (以 referredBy 属 性 建 模 ( @) ) 是 一 个 这 方面 的 非常 好 的 例子 。 注 意 这 个 属性 必须 是 另 
一 个 万 点 实体 的 5| 用 。 


对 零 个 或 对 多 个 其 他 节点 实体 的 基本 关系 可 以 用 Set、List、Collection 或 lterable 类 建 模 ， 把 引用 的 节点 实体 作为 集合 类 。 
Set、List 或 Collection 类 的 使 用 表示 从 包含 的 节 挟 的 角度 看 字段 被 修改 了 ; lterable 类 表明 这 应 该 是 只 读 。 基 于 包含 的 节 扣 实 体 
的 类 型 和 它 的 注释 ，SDN 能 够 知道 这 个 字段 代表 一 个 基本 关系 。 然 而 ， 如 果 你 想 履 兰 任 何 的 默认 推 新 ， 你 可 以 加 一 个 
@ RelatedTo 注 释 。 用 户 之 间 的 friends 关 系 (人 @) 是 一 个 例子 。 注 意 在 这 种 情况 下 如 何 添加 具有 type 属 性 的 @RelatedTo 注 释 
来 指定 低层 Neo4j 关 系 为 |S_FRIEND_OF， 而 不 是 在 没有 指定 值 的 时 候 SDN 推 断 的 默认 值 。 在 没有 注释 的 情况 下 ，SDN 将 使 用 字 
段 的 名 字 friends 作 为 低层 天 系 类 型 属性 的 名 字 。 


具有 相关 属性 的 Neo4j 低 层 关系 代表 的 丰富 关系 也 是 以 同样 的 Collection 类 作为 基本 关系 建 模 的。 然而 ， 在 这 种 情况 下 ， 在 
集合 中 包含 的 实体 的 类 型 是 一 个 关系 实 体 而 不 是 一 个 节点 实体 。 作 为 概括 ,一 个 关系 实体 代表 低层 Neo 笑 关系 与 相关 的 属性 ， 这 
些 也 是 以 实体 建 模 的 (参见 9.2.4 节 ) 。 这 提供 了 一 种 巧妙 的 万 法 访问 关系 本 身 的 丰富 信息 ， 而 且 仍 然 能 够 获得 另 一 端的 实体 。 
由 于 只 用 基本 关系 ， 不 用 任何 注释 ，SDN 能 够 推测 你 正在 创建 这 样 的 5 上 用， 这 个 引用 仅仅 基于 在 集合 中 包含 的 类 类 型 已 经 久 定 
义 / 一 个 关系 实体 。 再 一 次 训 明 ， 如 果 你 想 履 关 SDN 假 定 的 任何 这 些 默认 的 关系 ， 可 以 使 用 @RelatedToVia 注 释 。 正 像 你 早已 


看 到 的 ，views 字 段 引 用 ( 合 ) 所 代表 的 一 个 User 和 一 个 Movie 之 间 的 关系 是 一 个 很 好 的 例子 ， 额 外 的 stars 评 级 增强 了 这 两 个 实 
体 之 间 关 系 的 信息 。 注 意 在 User 和 Movie 节 点 情况 下 用 在 views 属 性 中 的 不 同 Collection 类 ， 即 Set<Viewing> 和 
lterable<Viewing>。 这 意味 着 从 User 节 点 的 角度 看 views 属 性 可 以 被 修改 ,但 是 从 Movie 节 氮 的 角度 则 不 可 以 修改 。 从 概念 
讲 ， 用 户 评价 电影 ; 电影 不 能 评价 用 户 。 

@RelatedTo (@) 、@RelatedToVia (和 上) 和 注释 (人 @) 都 能 够 设置 类 型 并 且 具 有 可 选 方向 的 元 素 ， 用 以 指定 说 明 关 系 
是 否 具 有 特定 的 方向 (有 效 值 是 INCOMING、BOTH 和 默认 值 OUTGOING) ， 并 应 该 包含 在 返回 的 实体 集中 。 


注意 对 friends 属 性 你 需要 指定 方向 为 BOTH (双向 ) ， 如 下 面 的 程序 所 示 : 


BRelatedToltype = "IS8 FRIEND OF", direction = Direction. BOTH) 
Set<User> friends. 


从 逻辑 上 讲 ， 一 个 friends 关 系 是 双 同 的 ;， 然 而 ， 在 Neo 笑 内 ， 天 系 实际 上 仪 仅 以 一 个 方向 存储 。 通 过 指定 BOTH， 你 告诉 
Neo4j 要 考虑 任意 的 与 用 户 相 关 的 IS_ FRIENDS_OF 关 系 ， 而 不 必 考 虑 定义 的 实际 关系 的 方向 。 


9.3 ”访问 和 持久 化 实体 


你 已 经 看 到 如 何 使 用 注释 为 SDN 提 供 基 本 信息 ， 用 于 映射 POJO 类 到 低层 图 形 支 持 的 数据 库 ， 而 不 需要 很 多 的 低层 节点 或 关 
系 类 。 这 是 一 个 在 你 的 域 模型 代码 中 仅仅 处 理 商 业 级 概念 的 巨大 进步 。 下 一 个 逻辑 问题 是 如 何 能 与 这 些 实体 交互 和 "后 样 能 加 载 并 
保存 来 目 于 或 回 到 图 形 数据 库 中 的 POJO 实 体 。 


SDN 在 这 一 领域 提供 了 几 个 选项 ， 本 节 中 我 们 将 重点 关注 其 中 的 两 个 ， 即 Neo4jTemplate 类 和 更 通用 的 Spring 数 据 库 概 
念 。 在 这 之 前 ， 我 们 将 看 看 支持 Spring 的 配置 ， 并 对 其 进行 配置 以 保证 正常 运行 。 


9.3.1 支持 Spring 的 配置 


程序 9-6 给 出 了 激活 SDN 需 要 的 最 低 XML Spring 配制 ，SDN 可 以 用 以 查找 域 实 体 并 且 生 成 许多 不 同 种 类 的 有 用 工具 (例如 
Neo4jTemplate) 。 


【程序 9-6】 基于 XML 的 Spring 配置 


<beans xmlns='http:/ /Ww. springframework.org/schema/beans' 


xmlns:neo4ij=http:/ /www. springframework.org/schema/data/,neod] 


neod4] :config storeDirectory="target, sample-db" 
base-package= "com,.manning.neod4jia.chapter09 .simple.domain" /> 


</beansy> 


SDN 使 用 neo4j: config 入 口 做 许多 初始 化 工作 ; 例如 ， 可 以 将 storeDirectory 属 性 作为 一 个 方便 的 方式 来 引用 图 形 数据 库 
(如 果 数 据 库 不 存在 就 创建 一 个 新 数据 库 ) 。 在 SDN 3.0 以 前 的 版 本 中 ， 使 用 base-package 属 性 指定 域 实体 定义 所 在 的 目录 或 
目录 列表 是 强制 性 的 。 


全 注意 


如 果 你 不 喜欢 XML， 可 以 使 用 SptingJava 设 置 获得 同样 的 输出 。 


让 我 们 继续 看 看 如 何 使 用 Neo4jTemplate 类 与 实体 进行 交互 。 
9.3.2 Neo4jTemplate 类 


Neo4jTemplate 是 一 个 SDN 类 ， 能 用 于 实例 化 ， 可 以 直接 使 用 或 当 Spring 初 始 化 时 用 于 你 的 应 用 程序 。 相 似 于 一 些 其 他 成 
功 的 Spring 模板 类 的 精髓 (例如 JDBCTemplate 和 JMSTemplate) ，Neo4jTemplate 类 的 目标 是 提供 一 个 万 便 、 人 简单 的 API 与 
低层 类 和 低层 Neo 浊 基于 图 形 类 的 行为 需求 进行 交互 。 


非常 有 趣 的 是 ， 如 果 合 适 ，SDN 框 架 本 身 也 会 使 用 Neo4jTemplate 做 许多 内 部 工作 。 但 是 模板 本 身 并 不 限定 于 仅仅 做 内 部 
工作 ， 也 可 以 用 作 选 项 之 一 调用 SDN 周 围 实体 的 基本 遂 数 。 


Neo4jTemplate: 人 们 强 有 力 的 工具 ! 


Neo4jTemplate 类 也 提供 许多 其 他 低层 应 用 方法 用 于 操作 、 查 询 以 及 获得 对 节点 和 关系 的 访问 。 如 果 你 真 的 需要 深入 虎 
穴 ” 并 且 想 获得 更 加 精细 的 控制 ? 这 是 SDN 提 供 的 深入 到 核心 低层 API 的 方法 之 一 。 一 定 要 在 某 种 程度 上 探索 所 有 可 能 的 其 他 方 
法 。 


程序 9-7 是 一 个 演示 如 何 使 用 最 基本 形式 的 Neo4jTemplate 类 来 保存 和 加 载 User 实 体 的 例子 。 


【程序 9-7】 一 个 基本 的 Neo4jTemplate 例 子 


GraphDatabaseService graphDB = getGraphDatabase ().; _ | 需要 引用 图 形 
Neo4JTemplate template = new Neo4j]Template (graphDB)., 数 指 库 
仅 寿 和 作 域 对 浊 try (Transaction tx = template.getGraphDatabaseService() .beginTx()) 1 
(模板 本 身 除 让) User user = new User("Johno0l", "John"):; 
User savedUser = template. saveluser); 
User loadedUser = template.findoOne (savedUser.getNodeId(), User.class): 


tx, success{): 


首先 ，Neo4jTemplate 类 需要 对 它 最 终 操 作 的 低层 图 形 数 据 库 的 一 个 引用 来 做 它 的 工作 。 前 几 章 用 到 的 以 本 地 Neo4j 结 构 
工作 的 GraphDatabaseService 也 是 以 同样 的 方式 工作 的 。 


在 程序 9-7 中 ， 尽 管 你 只 希望 处 理 真实 域 对 象 ， 但 是 还 会 有 许多 “噪声 ” (那些 样板 事务 代码 ) 。 通 过 充分 利用 具有 依赖 注 
入 (Dependency Injection，DI1) 为数 的 Spring 框架 ， 可 以 很 好 地 处 理 这 种 问题 。 按 照 这 种 方式 ， 你 的 代码 将 转换 成 如 程序 9- 
8 所 示 。 


【程序 9-8】 具有 完全 Spring 集成 的 一 个 Neo4jTemplate 例 子 


请 这 Spring 
纺 呈 使 得 可 用 


以 前 的 太 板 代 三 茹 注释 阔 换 


> Autowired Neo4jTemplate template; 
甸 Transacticnal 


public void saveAndLoad{() | 保存 节点 实 标 
T 3 n hn 本 季风 
User USEer = NIew User ("John00l", "John"):; 9 
; 上 辆 和 形 夫 柜上 计 
User SavedUser = template.save (user).; 到 图 形 数据 库 中 
User loadedUser = template.findone'! [| 请 讨 节 后 
savedUser.getNodeIld(}, User.class}, 1 编号 查找 
User loadedUserVvialndex = template 
findByIndexedValue lUser .class, 你 过 一 个 索引 查 提 
"UserId", "ohnool') 


.SingleOrNull (}). 


这 一 段 新 代 码 非 常 接近 Spring 的 完满 功能 ， 仪 仪 需要 写 核 心 业务 逻辑 ， 推 迟 所 有 的 Spring 低层 工作 。 样 板 事务 代码 现在 被 
@Transactional 注 释 所 代替 ， 指 导 Spring 以 确保 所 有 在 方法 中 执行 的 代码 包装 在 一 个 事务 中 。 


聚焦 到 核心 维护 逻辑 ， 你 可 以 看 到 创建 和 保存 一 个 新 实体 就 像 在 Neo4jTemplate 类 上 调用 save 方 法 (人 @) ， 作 为 参数 传递 
新 创建 的 基于 POJO 的 实体 一 样 简单 。Neo4jTemplate 在 数据 库 内 部 为 你 创建 了 一 个 新 的 节点 ， 赋 予 新 的 (或 者 重用 的 ) 图 形 节 
点 编号 ， 保 存 所 有 相关 的 属性 (userld 和 name) ,并且 索引 userld 属 性 。 

程序 9-7 展 示 了 两 种 方法 加 载 一 个 实体 。 第 一 种 方法 (人 @) 需要 相关 的 知识 并 且 要 访问 图 形 节点 编号 ， 在 这 其 中 有 作为 前 一 
个 调用 的 结果 保存 这 个 实体 (人 @@) 中 。 回 忆 一 下 ， 在 User 实 体 上 @Graphld 注 释 nodeld 属 性 是 SDN 存 储 低 层 节点 编号 所 必需 
的 。 你 现在 只 是 为 了 你 自己 的 查找 目的 简单 利用 了 这 一 信息 。 


在 节点 编号 不 可 用 或 不 知道 的 情况 下 ， 第 二 种 方法 是 通过 索引 userld 属 性 查找 实体 ( 合 ) 。 


尽管 这 段 代 码 没 有 像 它 应 该 的 那样 清楚 ， 但 它 确实 能 做 这 项 工作 。 在 下 一 证 中 ， 你 将 看 到 如 何 通 过 库 查 找 实体 ， 这 将 做 得 更 
好 并 隐藏 需要 做 索引 查找 以 及 其 他 函数 的 内 部 低层 工作 。 


9.3.3 ”等 源 库 


用 于 加 载 和 保存 实体 的 第 二 个 主要 选项 是 通过 一 个 资源 库 模 式 的 实现 来 讨论 的 ， 在 这 里 你 可 以 友 现 一 些 在 不 同 的 书 中 讨论 过 
的 内 容 ， 这 些 书 包括 Eric Evans 的 《Domain Driven Design》 和 Martin Fowler 的 《Patterns of Enterprise Application 


Architecture》。 


简单 来 襄 ， 一 个 知识 库 在 你 的 业务 代码 和 需求 的 所 有 逻辑 之 间 提 供 了 一 个 抽 儿 层 ， 用 以 转换 这 些 实体 到 它们 在 任意 低层 中 的 
格式 或 从 它们 在 低层 的 格式 转换 到 实体 。 你 的 商业 代码 应 该 以 域 语 言 去 处 理事 情 ; 这 些 域 实体 实际 上 如 何 加 载 和 保存 是 一 个 特定 
知识 库 实 现 的 工作 。 使 用 这 种 方法 ， 如 果 你 想 交 换 出 你 的 数据 存 取 ， 你 没有 必要 扔 挥 你 所 有 的 业务 代码 ， 而 是 用 一 个 知道 如 何 翻 
译 域 实体 到 或 从 数据 仓库 格式 蔡 换 适当 的 资源 库 实现 。 

SDN 人 资源 库 在 某 一 段 时 间 是 专门 设计 用 于 一 个 域 类 ， 并 且 它 们 是 针对 那个 域 类 提供 整个 沁 围 的 默认 操作 。SDN 人 资源 库 真 正 
的 优异 特色 是 它们 不 需要 你 写 一 行 代 码 来 实施 这 些 默 认 操 作 。 所 有 你 需要 做 的 是 定义 一 个 接口 和 指定 哪 一 个 域 类 你 想 要 这 些 操 作 
去 创建 。 


使 用 User 域 类 作为 一 个 例子 ， 让 我 们 看 看 这 项 工作 以 及 所 涉及 的 和 东西。 图 9-6 给 出 了 我 们 开始 的 点。 


注 人 :上 日 上 生病 腹 的 加 的 推移 上 
已 TE Ed 元 Hja EF Wit 滞 沪 i fe TE 全 
TraversalRepository< 工 > 由 SchemalndexRepository 代入 


schemalndexRepository<T> 
i CRUDRepository<T> 
SDN 后: 二 的 并 可 局 Pp TY 
4 种、 卉 的 各 种 其 
渍 将 u 晤 EE 四 摊 | | 


GraphRepository<T> 


性 定 兴 了 这 人 小。 吉 过 
全 Lse osltorv<User> 
六 本体 可 以 与 实体 进 LserRepository<=Liser 
1j 让 
运行 上 时间 宗主 蝎 由 Dynamic proxy implementation 
Spring 创建 时 接口 of UserRepository 


由 SDN 提供 ,在 封 盖 下 
吏 用 得 相 可 局 用 于 与 里 


体 丰 二 
图 9-6 ”涉及 访问 Uset 节 点 实体 的 SDN 资 源 库 类 概况 
下 面 的 一 行程 序 是 UserRepository 接 口 的 定义 ， 尤 其 是 对 User 域 (不 是 节点 域 ) 类 
public interface UserRepository extends GraphRepository<User> { } 
在 这 种 情况 下 ，UserRepository 接 口 扩 展 了 GraphRepository 接 口 ， 它 定义 了 对 域 类 可 用 的 默认 操作 的 最 广 的 集合 。Java 
泛 型 的 使 用 把 这 个 知识 库 (在 编译 的 时 间 ) 与 User 域 实体 联系 了 起 来 。 


GraphRepository 接 口 从 实质 上 巩固 了 所 有 其 他 的 接口 ， 因 此 为 用 户 定 义 了 包括 CRUD 的 操作 、 索 引 和 人 遍历。 下面 的 程序 给 
出 了 GraphRepository 接 口 包括 的 一 些 默 认 操 作 。 


public<U extends User>U save (U entity) ; 

* public<U extends T>Iterable<U>save (Iterable<U>entities) ; 
:public Uset findOne (Longid) ; 

* public boolean exists (Longid) ; 

public Result<User>findAll () ; 


* public void delete (User entity ) 


SDN 建 立 在 为 Spring 数据 工程 提供 共享 基础 设施 的 Spring Data Commons 模 块 定义 的 抽象 概念 基础 上 。SDN 负 责 实施 接 
口中 知识 库 扩展 的 基本 方法 (例如 ，UserRepository 情 况 下 的 GraphRepository 接 口 ) ， 提 供 一 套 统 一 的 函数 支持 对 一 个 实体 
的 通用 的 加 载 、 保 人 存 、 碍 询 、 索 引 和 遇 历 等 操作 。 


程序 9-1 说 明了 如 何 使 用 UserRepository 加 载 和 保存 用 户 。 


【程序 9-9】 ”通过 UserRepository 加 载 和 保存 数据 


Bt OW1EEQ 


UserRepository userRepository; 


BTrarnsactional 


public void savehndLoad() 1 
[jser USET = TeWw Userl" onnd0l", "John'y. 
USer SavedUser = USerReposltory. Save (user).:; 


User loadedUser = USerRepository.findoOne (savedUser .getNodeldl()); 
User loadedUserVialndex = 
USerRepository.findBySchemaPropertyvalue ("UsSerId", "ohnool")., 


Tg 


你 会 注意 到 这 段 代 码 与 程序 9- 7 使 用 的 Neo4jTemplate 方 法 (不 需要 提供 一 个 目标 类 型 除外 ) 的 代码 非常 相似 。 
Repository.save 方 法 保 仔 实体 到 图 形 数据 库 中 ， 是 由 findOne (基于 节点 编号 ) 或 findBySchemaPropertyValue (基于 索引 查 
找 ， 在 这 种 情况 下 是 针对 userld 属 性 ) 加 载 完成 的 。 为 了 让 Spring 知道 你 定义 的 任意 知识 库 接口 ， 它 需要 被 告知 。 添 加 以 下 代码 
到 你 的 Spring XML 配置 文件 中 融 将 实现 这 一 目标 。 


neod] :repositories base- 
package="cCom.manning.neo4jJlia.chapter09simple.repository",»> 
谁 实现 我 的 接口 ? 


可 能 已 经 有 人 看 出 了 我 们 从 没有 实际 上 对 UserRepository 接 口 定 义 任意 具体 的 实现 。 我 们 只 简单 地 通过 Spring 的 (@Autowired 注 
释 将 其 调 入 ， 然 后 使 用 它 ， 设 法 读 和 保存 User 域 实体 。 因 此 ， 如 果 我 们 从 不 提供 任意 的 实施 ， 是 由 谁 完成 ， 并 且 是 怎样 完成 这 项 
工作 的 呢 ? 


这 里 并 不 涉及 魔法 。 发 生 的 这 一 切 都 是 SDN 使 用 在 XML 配制 文件 中 提供 的 初始 化 软件 包 寻 找 你 的 知识 库 定义 ， 然 后 动态 地 
创建 一 个 实施 你 的 接口 的 一 个 代理 ， 并 且 使 其 成 为 一 个 Spring 组 件 。 这 个 代理 做 实现 在 核心 接口 中 定义 的 函数 的 所 有 艰苦 工作 。 


你 仅 简单 地 通过 扩展 一 个 接口 就 获得 了 一 大 堆 函数 。 

知识 库 比 Neo4jTemplate 类 高 一 级 ， 它 们 也 提供 许多 样板 代码 的 实现 ， 但 以 更 针对 域 的 方式 。 
9.3.4 ”其 他 选项 

除 使 用 Neo4jTemplate 类 和 知识 库 以 外 ， 当 保存 实体 时 还 可 以 用 第 三 种 方法 。 这 涉及 在 实体 本 身上 调用 一 个 保 丰 方法。 由 
于 它 只 在 使 用 高 级 的 映射 模式 时 可 用 ， 我 们 将 在 9.4.2 节 中 介绍 ， 但 是 这 里 我 们 也 简单 地 列 了 出 来 。 


也 会 有 一 些 这 样 的 情况 ， 你 的 域 对 象 需要 从 多 个 数据 源 加 载 数据 ， 这 称 作 交叉 仔 悄 维护 (cross-store persistence) 场景 。 
也 许 你 的 一 些 数 据 存 在 于 Neo 笑 中 ， 而 另 一 些 存 在 于 MySQL 中 。 你 将 兴奋 地 知道 SDN 也 适合 于 交叉 存储 维护 ， 尽 管 我 们 在 本 书 
中 不 讨论 这 个 问题 。 更 多 关于 交叉 存储 维护 的 信息 可 以 在 核心 Neo4 SDN 文 件 中 找到 。 

SDN 与 原始 Neo4 笑 能 一 起 配合 工作 的 很 好 吗 ? 


从 读数 据 、 查 询 和 遍历 的 角度 看 ， 任 何 从 SDN 写 进 低层 数据 库 的 数据 ， 都 可 以 使 用 到 目前 为 止 接触 过 的 所 有 本 地 Neo4j 工 


具 ， 例 如 通过 网 页 管理 员 控 制 台 (Web Admin Console) 的 Cypher 和 Neo4j Shell 等 ， 以 只 读 方 式 安全 访问 。 


SDN 试 图 以 最 不 引 人 注 目的 方式 在 图 形 数据 库 中 存储 数据 ， 但 是 它 需要 存 一 些 元 信息 以 便 做 一 些 它 需要 做 的 事情 。 例 如 ， 有 
几 种 不 同 的 方式 可 以 在 图 形 数据 库 中 代表 域 模型 的 Java 层 级 ， 并 且 这 些 选 项 可 以 用 类 型 表示 策略 (type representation strateey) 来 
管理 。 这 些 策略 依赖 于 存储 一 些 信息 到 图 形 数 据 库 中 。LabelBasedNodeTypeRepresentationStrategy (是 SDN 3.0 及 以 上 版 本 的 默认 
策略 ) 对 基于 节点 实体 的 简单 类 名 的 低层 节点 创建 标签 。IndexingNodeTypeReptesentationSttateoey 对 每 一 个 节点 实体 创建 传统 的 过 
引 以 及 添加 一 个 _type_ 必 性， 而 SubRefetenceNodeTypeReptesentationSttategy 可 以 在 实体 之 间 创 建 INSTANCE_OF 和 SUBCLASS_OF 
的 关系 。 


如 果 你 想 要 在 SDN 外 更 新 低层 实体 ， 你 将 需要 理解 并 考虑 这 一 额外 的 元 信息 。 例 如 ， 创 建 一 个 新 的 Person 实 体 可 能 不 只 是 涉 
及 在 图 形 数据 库 中 添加 一 个 具有 基本 属性 的 节点 。 


我 们 不 可 能 涉及 SDN 存 储 和 使 用 元 信息 的 所 有 情景 ， 但 是 我 们 可 以 在 这 里 强调 这 一 点 以 提醒 你 在 使 用 SDN 时 ， 应 注意 到 这 一 
点 和 其 可 能 对 你 的 限制 。 


关于 更 多 可 用 代表 策略 的 不 同类 型 信息 ， 可 以 参见 详细 的 “实体 类 型 表示 ” http:/ /docs.spring.io/sprine- 


data/neo4]j/docs/current/reference/html。 


在 最 后 介绍 如 何 使 用 实体 实现 查询 和 遍历 之 前 ， 让 我 们 先 讨论 一 人 OGM。 在 本 章 中 ， 我 们 偶尔 会 提 到 简单 对 象 映射 
(simple object mapping) ， 现 在 我 们 将 说 明 这 严格 意义 上 指 的 是 什么 。 


9.4 ”对象 图 形 映 串 选项 


SDN 提 供 了 两 种 执行 域 POJO 和 低层 图 形 实体 之 间 的 映射 模式 : 简单 映射 和 高 级 映射 。 理 解 这 两 种 映射 操作 方式 的 不 同 将 帮 
助 你 评估 权 稀 每 一 种 万 法， 并 且 决 定 哪 一 种 方法 最 适合 你 的 项 目 ( 当 你 使 用 SDN 时 ) 。 选 择 有 一 点 像 企 DOM 和 SAX XML 解析 器 
之 间 做 决定 一 一 两 个 都 做 同样 的 事情 ， 但 是 解析 器 XML 以 非常 不 同 的 方式 并 以 隐 式 万 式 做 选择 。 


不 管 你 选择 的 是 简单 映射 还 是 高 级 映射 模式 ， 确 定 从 映射 得 到 了 什么 到 两 种 模式 的 相同 点 的 过 程 企 9.2.2 节 中 从 概念 上 注释 
域 模 型 做 了 摘 述 。 简 单 襄 ， 这 种 映射 过 程 涉及 SDN 解 析 器 和 分 析 所 有 已 知 世 点 和 天 系 实 体 。 在 Java 反 射 API 的 一 点 帮助 下 ，SDN 
建 六 了 一 个 内 存 里 的 映射 规则 元 模型 。 这 些 规则 后 面 被 用 于 做 这 些 繁重 工作 ， 即 在 域 模型 和 图 形 微 元 之 间 前 后 移动 的 工作 ， 在 每 
次 合适 的 时 候 做 转换 。 


补 宛 信息 


在 Spting Data Neo4j 2.0.0 版 本 之 前 ， 只 支持 高 级 方法 (基于 AspectJ 的 映射 ) 。AspectJ 是 一 个 Java 的 面向 方面 编程 (AOP) 范 
例 的 实施 一 一 参见 http://eclipse.ote/aspectj 。 在 SDN 中 ， 由 于 无 缝 集 成 的 Neo4j 数 据 库 和 Java 域 模型 的 机 制 ， 它 看 上 去 是 动态 拦截 
POJO 上 的 方法 调用 。 


对 来 自 社区 反馈 的 反应 ， 添 加 这 个 简单 映射 模式 用 以 解决 许多 与 Aspectj 工 具有 关 的 问题 和 关切 ， 以 及 其 他 一 些 通过 这 个 更 


复杂 的 设置 而 带 来 的 更 为 一 般 的 影响 。 应 该 注意 到 ， 现 在 更 多 的 焦点 应 该 集中 到 更 新 和 使 这 个 简单 模型 成 为 使 用 SDN 的 实际 方 
式 。 


9.4.1 简单 映射 


人 入 单 映射 模式 是 默认 的 模式 ， 不 需要 特殊 的 设置 ， 涉 及 在 任何 的 加 载 操作 中 复制 数据 到 一 个 书 点 实体 中 ， 只 在 调用 显 式 保存 
操作 时 ， 才 会 出 现 写 回 到 图 形 数据 库 中 。 图 9-7 给 出 了 一 个 简单 映射 模式 。 


尽管 这 个 万 法 简单 ， 但 应 该 注意 这 种 简单 映射 对 内 存 的 固有 影响 。 因 为 这 种 简单 方法 涉及 在 域 实体 和 它们 的 低层 代表 之 间 的 
数据 复制 ， 你 需要 时 刻 注 意 你 的 内 存 占用 ， 由 于 每 一 样 东 西 实质 上 是 加 载 了 两 次 次 通过 节操 ， 而 后 当 所 有 的 东西 都 复制 
时 再 一 次 通过 域 类 。 另 外 ， 这 种 方法 也 会 市 来 性 能 上 的 损失 ， 因 为 你 不 得 不 经 常 保持 复制 图 形 来 做 某 些 操 作 。 


因此 ， 让 我 们 看 看 下 面 的 程序 并 深入 了 解 当 加 载 和 调用 保存 方法 时 将 友 生 什么 ， 以 及 两 者 之 间 将 友 生 的 一 切 。 


用 副 域 实体 
-合用 地 点 网 号 色相 | 查找 从 图 形 数 据 库 中 取 回 
已 存在 的 第 点 1/ 和 

-从 市 太 /天 系 复制 基本 属性 到 域 实体 POJO 

- 对 任何 没有 用 区 Fetch 注释 的 关系 延迟 存储 市 


GraphR epository<T> 


吕 曾 村 
- 预先 加 载 任 何 的 关系 到 有 @Fetch 注释 的 实体 


UserRepository 国 动 洽 
协议 实施 


Ler EOJO Node 


nodeld: muyll "Tnmnodeld™ 3z2] 
NeodiTemplate E 入 


John 
USerld: Johnovl "Userld": Johnoo0l | 


Neodi 
开拓 证 


或 者 使 用 域 特定 资源 库 或 者 | [B ) 保 存 域 实体 
站 反 贡 过 NeodjTemplale 匹克 | | - 创建 新 的 或 从 图 形 中 取 回 已 存在 的 节点 / 关系 
SDN 国运 代 _ 确定 域 实体 POJO 上 哪 一 个 属性 是 新 的 或 已 经 


波 更 新 过 

- 更 靳 了 = 人 技 图 形 中 的 但 

- 加 载 一 个 新 维护 的 或 更 新 的 实体 新 副本 并 妈 回 
划 员 用 并 


图 9-7 ”简单 映射 逻辑 概况 
【程序 9-10】 ”加 载 和 保存 
ETransactional 


public void saveaAndLoad() | 


Long JohnNodelId = getJohnNodeIdt); 
User loadedUser = userRepository.findone(johnNodeId)); 十 人 加 栽 实体 


// Start: All changes between these Start/End 
/7 markers are only performed in memory 
loadedUser .setName ("New Name").:; 


User SuUuSan = new UsSer ("susand0do0l"", "Susan): 
loadedUser.addFriend (susan) 


/Ena 修改 在 这 里 保存 到 图 形 中 
= USerReposilitory. Save lloadedUser).; L 


User sgavedUser 


通过 CRUDRepository 接 口 可 获得 的 findOne 方 法 (人 @) 被 分 为 加 载 方法 之 一 。 当 这 一 行 代码 执行 时 ，SDN 将 会 做 三 件 事 


情 : 


创建 一 个 新 的 Uset 对 象 。 
:加载 低层 节点 类 到 内 存 。 
: 对 每 一 个 属性 和 某 些 关系 〈 那 些 没 有 @Fetch 注 释 的 ， 我 们 将 很 快 接触 到 ) ， 从 图 形 中 复制 出 数据 到 POJO 类 属性 。 


下 一 次 SDN 与 低层 节点 交互 是 在 一 个 显 式 保存 调用 时 (人 @) 。 这 些 点 之 间 从 来 没有 导致 一 个 对 低层 数据 库 的 调用 ; 所 有 的 
事情 是 在 域 对 象 上 完成 的 。 从 技术 上 讲 ， 刚 刚 创 建 或 修改 还 没有 保存 的 实体 被 称 为 处 于 分 离 状态 。 


1. 传 递 的 持久 性 


关于 这 些 代码 另 一 个 值得 一 提 的 点 是 在 John 被 保存 时 (人 @) ，Susan 也 被 保存 。 因 此 ，John 有 什么 特殊 的 ? 每 当 调 用 一 个 
保存 操作 时 ，SDN 将 会 看 看 要 保存 的 对 象 (在 这 种 情况 下 是 John) 并 且 从 被 保存 节点 的 角度 检测 是 否 有 新 的 或 变化 的 内 容 ， 包 
括 关系 。John 具 有 了 新 年 龄 和 名 字 并 且 有 了 一 个 新 朋友 。 因 此 ，SDN 保 存 修改 了 数据 的 全 部 对 象 图 形 ，Susan 也 会 被 保存 。 记 
住 由 只 读 句法 定义 的 天 系 属性 是 (也 就 是 说 ， 那 些 |terable 集 合 类 ) 不 能 被 更 新 的 。 


2. 预 先 加 载 VS 延 迟 加 载 


当 保存 John 时 ， 默 认 会 保存 Susan， 但 是 当 John 加 载 时 Susan 也 加 载 了 吗 ?” 官 方 的 回答 是 “取决 于 不 同 的 情况 ”。 如 果 
SDN 是 在 默认 的 设置 情况 下 ， 束 像 现 在 这 种 情况 ， 答 案 是 “不 ”。 这 是 因为 在 默认 情况 下 ， 当 加 载 一 个 基于 关系 的 实体 属性 
时 ，SDN 并 不 参与 预先 关系 实例 化 。 


预先 加 载 将 会 涉及 SDN 主 动 跟 路 一 个 实体 可 能 存在 的 任何 关系 并 且 后 面 也 会 加 载 这 些 实体 ， 包 括 它们 所 有 的 属性 以 及 它们 
的 关系。 当 不 是 显 式 的 需要 时 ， 为 了 保留 内 存 并 且 避 免 潜 在 的 加 载 大 量 的 图 形 到 内 存 中 ，SDN 默 认 使 用 延 返 加 载 。 


因此 ， 如 果 你 想 了 解 延迟 加 载 的 实体 将 会 友 生 什么 情况 ?看 一 看 下 面 的 程序 。 


【程序 9-11】 ”延迟 加 载 的 隐 合 谷 义 


[ser john = TleW Ugser ("ONnnool" , "John").; 
User sally = Tew USer ("sallvoo0l", "Sally"),. 


john.addFriends (sally)., 
template. save (john).; 


User loadedsally = template.findone (sally.getNodeIdl}, User.clagss).; 
asSertEduals(l1l, loadedsally.getFriends() ,sizel)); 
User firstFriendOfSusan = loadedsally.getFriends() .iterator() .next (); 
agsgsertEquals( John.getNodeId() ,firstFriendOofsusan.getNodeld'())})., 
assertEgquals( null, firstFriendofsusan .getName ()).; 

用 户 集 延 衣 加 载 ， 只 加 载 了 节点 编号 属性 


对 每 一 个 延迟 加 载 的 节点 实体 ，SDN 仍 然 为 低层 实体 实例 化 节点 实体 POJO ， 但 是 那 只 会 加 载 由 @Graphld 注 释 的 属性 。 程 
序 9-11 的 单元 测试 代码 可 以 访问 nodeld， 但 是 ， 在 此 刻 name 仍 然 是 null。 


当 想 要 加 载 整 个 实体 上 时， 你 可 以 使 用 Neo4JTemplatefetch 万 法 ， 如 下 面 的 扩展 程序 所 示 ， 这 需要 添加 到 程序 9-11 中 : 


template.,fetchiloadedSsally.gqetFriends!())}.; 
agssertEqualsl "John", fi1rstFriendOftSsusan.gqetName ()}:; 


另外 ， 如 果 你 想 要 SDN 在 加 载 时 预先 实例 化 实体 ， 可 以 用 @Fetch 注 释 适 当 的 属性 ， 如 下 面 的 程序 所 示 : 


男 Fet ch 
@RelatedTo (type = "IS FRIEND OF", direction = Direction .BOTH) 


Set<lsers Trliends:; 


现在 你 对 简单 映射 模式 有 了 一 个 简单 的 概况 ， 可 以 概括 为 “简单 且 功 能 强大 ， 但 是 仔 企 潜在 的 内 和 存 危机 ”， 接 下 来 我 们 将 介 
绍 高 级 映射 。 


强制 性 的 @ Graphld 属 性 应 该 被 定义 为 一 个 长 数据 型 


简单 映射 要 求 域 建 模 者 提供 一 个 用 @GraphId 注 释 的 属性 存储 相关 的 节点 或 关系 的 ID， 提 供给 库 一 个 到 低层 节点 或 关系 的 连 
接 以 支持 它 。 当 实体 还 保存 在 Neo4j (通常 是 当 你 用 关键 字 nhew 创 建 实体 时 ) 时 其 值 将 是 null， 但 是 当 它 至 少 保存 过 一 次 时 ， 它 将 
会 用 于 反映 在 图 形 中 与 其 相关 的 低层 节点 或 关系 。 


这 里 有 几 和 名 警示 语 。 确 保 你 定义 这 个 属性 为 长 数据 型 (Long datatype) 而 不 是 长 元 型 (long primitive) 。 包 装 类 允许 指定 
null， 表 示 这 个 实体 还 没有 保存 到 图 形 数据 库 中 。 如 果 你 定义 这 个 字段 为 长 元 型 ， 这 将 意味 着 它 的 默认 值 总 是 0。 然 而 ， 零 可 以 代 
表 一 个 真实 的 节点 编号 (在 Neo4j 2.0 之 前 ， 图 形 数据 库 中 引用 的 节点 总 是 节点 零 ) 。 这 将 导致 被 存储 和 读 取 数据 的 所 有 类 型 的 错 


误 。 如 果 一 个 实体 还 没有 保存 到 图 形 中 ， 你 真正 想 要 的 是 一 个 节点 编号 为 null 的 节点 。 


9.4.2 ”基于 AspectJ 的 高 级 映射 


高 级 映射 模式 依赖 于 AspectJ 库 ， 这 是 由 于 它 的 机 制 是 为 了 实现 在 注释 的 POJO 域 类 和 图 形 数据 库 中 的 低层 实体 之 间 的 映射 
和 转换 逻辑 ( 见 图 9-8) 。 


Aspectj ( 见 http://eclipse.org/aspectj) 是 一 个 Java AOP 泡 例 的 实现 (http://en.wikipedia.org/wiki/Aspect- 
oriented_programming) 。AOP,， 作为 一 个 范例 ， 目 的 是 在 代码 库 中 增加 模块 化 程度 ， 尤 其 是 为 了 允许 常见 跨 领 域 天 注 的 解 
决 和 从 主 代 码 中 抽取 最 终 分 离 存 储 的 目的 (作为 某 一 方面 ) 。 跨 领域 天 注 是 一 些 常 见 的 逻辑 ， 在 代码 库 中 的 多 个 点 需要 ， 但 是 核 
心 的 本 身 并 不 需要 (引用 的 典型 例子 是 登录 和 事务 管理 ) 。 这 个 关切 或 问题 在 某 种 程度 上 能 够 被 配置 为 在 适当 的 时 候 应 用 于 你 的 
代码 库 (实现 的 万 法 不 同 ) 。 


SDN 是 如 何 利 用 AOP (尤其 是 AspectJ) 在 POJO 类 和 低层 图 形 实体 乙 间 做 它 的 常见 转换 和 翻译 逻辑 的 ? 


首先 ， 不 像 简 单 映 射 ， 都 是 在 运行 时 发 生 ， 高 级 映射 取决 于 一 些 编译 时 的 设置 和 配置 。 这 涉及 在 你 的 项 目 中 包含 一 个 特定 的 
感知 Aspect 版 本 的 SDN ， 以 及 使 用 Aspect (ajc) 编译 器 。 详 细 的 配置 在 附录 C 中 讨论 。 
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而 屋 了 二 工 下 可 


一 下 


—" EntityState generatedRefToNode; 


public 


a 
public 


Fi 
I 


public 


i ; 
上 下 
站 
public 
f 
1 
Dublicec 


c void remove{) 1 


运行 轩 则 


String getNamel) 
aspectJ generated code 


void setNamesString name) 
S 


aspectJ generated code 


User persist (} 1 
aspectJ generated code 


' AaspectJ generated code 


lic Long getNodeldl() 1 


aspectJ generated code 


Node 
(Td 10 
"name" 
"ohn" 


一 泪 及 任何 映射 属性 的 大 用 延 送 到 低层 节点 ref 


图 9-8 


高 级 映射 概况 


SDN 将 扫描 你 的 代码 查找 所 有 的 @NodeEntity 和 @ RelationshipEntity 类 。 然 后 会 使 用 特定 的 AspectJ 编 译 器 提取 这 些 


POJO 域 类 ， 并 用 它们 自己 的 目 定义 版 本 蔡 换 它们 。 


其 次 ， 这 个 目 定 义 制 作 类 具有 两 个 值得 注意 的 特点 ， 第 一 个 是 对 一 个 实际 节操 或 天 系 的 直接 引用 ， 作 为 


个 内 部 隐藏 的 字段 


附 审 到 类 上 。 由 Aspectb 编 译 器 产生 的 附加 代码 ， 与 这 个 隐藏 字段 天 联 在 一 起 ， 确 保 Neo4j 广 持 的 任何 读 或 写 到 属性 中 的 代码 家 
修改 ,结束 代表 对 低层 实体 的 所 有 直接 调用 |。 


第 二 个 值得 一 提 的 特点 是 额外 的 与 维护 相关 的 方法 添加 或 混合 进 生成 的 类 ， 


与 一 个 主动 记录 类 型 的 方法 相 一 致 ， 也 吏 是 况 ， 


一 项 使 维护 代码 与 域 代码 一 起 存活 的 技术 。 这 是 由 保证 生成 的 类 实现 了 一 个 NodeBacked 或 者 RelationshipBacked 接 口 来 完成 


的 ,提供 了 适当 的 维护 和 查找 功能 的 实施 。 下 面 的 程序 给 出 了 如 何 使 用 这 些 与 维护 相关 的 方法 直接 操作 实体 。 


【程序 9-12 】 


隐 陈 事物 的 主动 记录 维护 


public void advancedUsageWithImplicitTransactions() 1 < 


了 号 基于” 这 全 县 于 三 及 多 太 User ("Onno0olr., 


i 


USer. SeEtName ("John the 2nd").， 


( (NodeBacked)} user) .persist ():; 


USEr. SEtName ("John the 3rd'"). 


( (NodeBacked) user) .pergsist ().: 


没有 事物 注释 或 封 
装 代码 定义 


"John tthe lst y, 


| 和 隐 式 事物 创建 


如 果 你 将 眼光 投向 程序 9-12 的 代码 ， 可 能 会 联想 到 几 个 问题 ， 例 如 ，“ 这 段 代码 还 能 运行 吗 ”? 缺少 事务 的 代码 的 确 看 上 
去 有 一 点 疑问 ， 因 为 所 有 的 操作 都 需要 企 事务 内 友 生 。 


记 住 节点 实体 可 以 以 两 种 状态 存在 : 附加 的 或 分 离 的 。 创 建 一 个 新 节操 实体 以 分 离 的 状态 出 现 ， 这 仅仅 意 味 着 这 个 实体 还 没 
有 进入 被 写 入 低层 图 形 数据 库 的 状态 。 


在 实体 上 (或 者 说 Neo4jTemplate”s save () 方法 ) 调用 persist () (人 @) 附加 实体 到 图 形 数据 库 中 。 附 加 确保 实体 的 
状态 与 图 形 数据 库 中 的 状态 同步 。 对 于 创建 的 新 实体 、 新 节点 和 属性 ， 还 有 那些 前 面 某 些 时 间 点 上 附加 的 实体 ， 它 们 需要 重新 附 
加 ， 确 保 自 从 上 一 次 附加 后 的 任何 变化 写 入 到 图 形 数据 库 中 。 

SDN 可 以 检测 你 的 代码 是 否 在 现 有 事务 的 沁 围 内 运行 。 如 果 不 是 ( 惑 像 样本 代码 的 情况 ) ，SDN 将 会 确保 与 附加 相关 方法 
的 调用 (在 这 种 情况 下 是 NodeBacked' s persist 以 及 Neo4jTemplate 的 保存 ) 将 会 为 你 创建 一 个 隐 式 事务 。 隐 式 事务 仅仅 是 
为 你 在 内 部 创建 的 一 个 新 事务 (人 @) ，SDN 会 在 后 面 使 用 它 做 变更 调用 并 将 状态 保存 到 图 形 数据 库 中 。 

尽管 在 这 里 已 经 提供 了 详细 的 关于 隐 式 事务 是 如 何 工 作 的 ， 我 们 还 是 建议 你 提供 显 式 事务 。 人 否则 ， 库 不 得 不 一 直 在 重新 附加 
分 离 的 实体 。 具 有 微小 的 隐 式 事务 也 会 严重 地 降低 应 用 程序 的 速度 。 

值得 注意 的 是 ， 每 当 访 问 域 实体 的 一 个 属性 或 关系 时 ， 使 用 高 级 映射 模式 将 会 涉及 通读 数据 库 到 底部 。 为 避免 多 次 读数 据 
库 ， 可 能 有 时 可 以 合理 地 存储 数据 或 存储 临时 的 结果 ,或 者 两 者 都 存储 ， 在 局 部 变量 中 存储 而 不 是 通过 域 实体 本 身 反 复 的 查询 数 
据 。 根 据 你 如 何 与 实体 交互 ， 这 个 局 域 变量 可 以 局 限于 一 个 方法 内 部 ， 实 体 类 本 身 内 部 ， 甚 至 另外 一 个 类 内 部 。 这 将 有 利于 提高 
性 能 ， 但 是 额外 的 变量 也 会 加 到 你 的 整个 内 存 占 用 中 ， 因 此 ， 你 应 该 时 刻 清楚 这 一 点 。 

如 果 在 一 个 已 存在 的 事务 中 操作 将 会 友 什 么 ? 

在 代码 执行 前 ， 如 果 你 在 前 面 已 经 创建 或 开始 一 个 显 式 事务 (而 不 是 依赖 于 隐 式 事务 ) ，SDN 将 不 会 试图 创建 自己 的 事务 。 
SDN 将 会 仅 在 已 存在 的 事务 已 建立 的 边界 范围 内 操作 ， 提 供给 你 使 用 标准 事务 的 所 有 控制 功能 (例如 ， 回 深 ) ， 这 些 是 你 已 经 习 
惯 了 的 功能 。 

到 这 里 瓯 结束 了 我 们 关于 高 级 映射 模式 的 简要 概况 。 为 了 减少 当 你 设 定 Aspectj 开 上 友 环 境 会 遇 到 有 天 配置 的 头痛 问题 (这 也 
是 主要 抱怨 之 一 并 导致 了 简单 映射 模式 的 引进 ) ， 相 对 于 简单 的 映射 模式 ， 你 可 以 较 好 地 使 用 可 用 的 内 存 。 如 果 处 理 不 当 的 话 ， 
也 会 有 一 些 读 取 属性 性 能 的 损失 。 


9.4.3 “对象 映射 总 结 


表 9-1 比 较 了 简单 和 高 级 映射 模式 。 


表 9-1 简单 和 高 级 映射 模式 对 比 


人 缺点 


阿 单 、 直观 、 易 于 理解 ; 随 着 在 实体 和 节点 之 间 来 回复 制 数据 ， 可 能 耗 

阿 半 肌 射 模 陈 随手 就 用 :; 尽 内 三 ; 

不 需要 特殊 的 开发 环境 慢 

通读 方式 可 能 对 内 存 使 用 更 有 效 ; 如 于 有 六 多 的 细小 再 用 ， 

如 果 需 要 的 话 可 以 提供 使 用 主动 记 | 通读 方式 可 能 会 对 性 能 有 影响 ; 
录 维 护 功 能 ; 涉及 隐 式 事务 程序 的 错误 很 难 跟踪 和 解决 ; 

快 [ 具 ， 尤 其 是 关于 AspectJ 的 开发 环境 ， 例 如 ， 
Eclipse 和 IntelliJ]， 被 认为 引起 开发 者 许 包 藉 痛 和 和 
无 眼 之 夜 . 也 是 Neod4i 社区 的 主要 烦恼 之 一 


高 组 AspectJ 映射 模式 


9.5 ”执行 合 询 种 忆 历 


为 了 结束 这 一 章 ， 让 我 们 讨论 一 下 SDN 如 何 延 伸 它 的 简易 编程 模型 使 之 能 够 以 非常 简单 的 方式 指定 和 使 用 查询 与 毅 历 。 假 
设 你 想 查 找 天 于 一 个 用 户 朋 友 的 朋友 的 信息 ， 我 们 可 以 使 用 一 个 主 域 的 子 模型 来 进一步 探测 这 种 情况 ， 如 图 9-9 所 示 。 重 点 关注 
用 尸 John， 朋 友 的 朋友 最 终 标 识 为 落 在 图 形 右 边 的 最 后 部 分 的 那些 用 户 。 


9.5.1 ”注释 至 询 


这 不 应 该 令 你 感到 惊讶 ，SDN 提 供 了 一 个 注释 (在 这 种 情况 下 是 @Query) 用 于 标识 一 个 执行 的 查询 。 当 你 要 返回 一 个 过 
渡 的 实体 列表 或 者 一 个 运行 时 确定 的 信息 子 集 时 ， 这 将 非常 有 帮助 。 注 释 可 以 用 于 一 个 节点 实体 的 一 个 字段 二， 或 者 知识 库 接口 
中 的 万 法 上 。 当 一 个 证 点 实体 上 的 字段 被 访问 时 ， 或 在 一 个 知识 库 接口 上 调用 一 个 万 法 时 ， 查 询 被 执行 并 且 返 回 结果 。 


1. 节 操 实 体 上 的 注释 


让 我 们 从 如 何 使 @Query 注 释 使 用 于 User 节 点 实体 开始 定义 一 些 涉及 朋友 的 朋友 的 场景 的 查询 : 


朋友 朋友 时 朋友 


i | 
I | 
! | 
I | 
1 上 
ff | 
I | 
I | name: Pam Porter 
| IS FRIEND QF 1 
A tyvpe: User 
. i | | 
' | 一 
name: Jack Jeffries 
mr J 
1Ss FRIEND OF | type: User : 
本 a 
+ ] 
name: John Johnson YY name: Susan Smith 
] type: User | | | type: User 
_ | | ee 
ee | 


| TaNME: Kate 


type: User FRIEND OF 


name: Tom Thvyme 
tvpe: User 


图 9-9 ”朋友 的 朋友 子 模 型 


BNodeEntity 
public class User 1 


EOUery! Vvalue = 
rmatch {n})-[r:IS FRIEND OF]- (friend)- [r2:1S8 FRIEND OF]- (fof) ™ + 
"where id{n) = {self} " + 
nreturn distinct fof") 
Iterable<User> friendsOfFriends.:; 


每 当 加 载 User 实 体 时 (不 论 通过 Neo4jTemplate 还 是 UserRepository 方 法 ) ， 注 释 中 定义 的 Cypher 查 询 将 会 被 执行 并 且 结 
果 会 存 到 变量 中 (在 这 种 情况 下 ， 变 量 是 friendsOfFriends) 。 


这 是 一 个 标准 的 Cypher 查 询 ， 仪 仅 对 {sel 人 的 引用 是 新 句法 ， 这 个 引用 是 指 支 持 这 个 实体 的 当前 编号 。 这 是 有 道理 的 ， 作 为 
定义 在 实体 上 的 查询 一 般 应 该 与 那个 实体 相关 。 如 果 你 的 查询 不 是 专门 的 与 查询 中 的 节点 实体 相关 ， 这 表示 它 可 能 需要 作为 一 个 
更 通用 的 方法 在 知识 库 中 定义 。 


你 可 以 通过 注释 的 params 属 性 提供 一 组 关键 值 动态 的 指定 查询 中 的 参数 。 下 面 是 另 一 段 程序 示例 如 何 回应 查询 ，“ 对 一 个 
指定 的 用 尸 ， 对 每 一 个 他 或 她 的 直接 朋友 ,统计 朋友 的 数量 并 返回 这 些 数 量 ”.。 


EOUerYy (Value 
match 和 FRIEND OF|- (fof}) 下 4 
where id(ln} = {self} " + 


"and typelr) = (ErienaRelLNamein + 
nreturn friend.name as friendName ; count (fof} as numFriends". 
params = {"friendRelName", "IS FRIEND OF"}) 
Iterable<Map<String,Object>» friendsoOfFriendsCount. 


由 于 你 不 是 返回 整个 实体 ， 但 是 也 不 是 数据 的 一 个 子 集 ， 这 个 查询 的 结果 将 会 是 一 个 只 读 入 口 集合 (lterable) ， 关 键 字 是 
在 查询 的 返回 阶段 定义 的 参数 名 字 ， 其 值 作 为 结果 。 使 用 图 9-9 中 的 图 形 作为 例子 ， 以 John 为 例 运 行 这 个 查询 将 得 到 如 下 的 答 


| 


杀 。 


{friendName=Kate, numFriends=2| 
(friengd 评 WN 忆 = 林 J 说 己 帮 ， numFriends=2| 


下 一 段 程序 给 出 了 如 何在 Cypher 中 返回 聚合 类 型 的 值 ， 例 如 计数 。 在 这 种 情况 下 ， 你 是 在 查找 朋友 的 朋友 忌 数 ， 这 里 根据 
图 9-9 所 摘 述 的 子 模型 ， 结 果 应 该 是 4。 


SWYuery (value = 
"match: {nn})-= [r:IS FRIEND OF] - (friend}-[r2:1IS FRIEND OF]- (fof}) ™ 
"where idln) = iself} "+ 
return Count (distinct fofy ™) 

Long totalNumFriendsOfFriends.:; 


+ 


2. 知 识 库 接口 注释 
@ Query 注 释 也 能 用 在 你 想 定 义 在 自己 实体 的 特定 知识 库 接口 上 的 方法 。 回 想 一 下 9.3.3 节 的 UserRepository。 下 面 的 程序 
给 出 了 当 对 知识 库 定 义 方法 时 查询 朋友 的 朋友 的 程序 。 
【程序 9-13】 ”知识 库 上 的 @Query 注 释 


public interface UserReposgitory extends GraphRepository<Usger»> | 


OUery! Vvalue = 
lmat chn (n}= [rr:IS FRIEND OF]- (friend)- [r2:1IS FRIEND OF] -~ (fof) 
rwhere id{n) = 10} "+ 


} 上 机 射 到 方法 定义 的 第 一 人 


T | 本 
| 1 | L J i 
rreturn distinct forf") ] i 
i FE ; | 着 {nodeIgd) 
Iterable<User> getFriendsOtrFriends (Long nodeld).; 入 数 (nodeIa| 


注意 你 已 不 再 使 用 {self} 引 用 了 。 现 在 ， 你 已 经 更 有 力 地 访问 了 传递 到 方法 中 的 参数 。 这 个 参数 可 以 作为 从 零 {0} 开 始 的 增 量 
值 ，{9 对 应 于 这 个 方法 中 的 第 一 个 参数 ，{ 们 对 应 于 第 二 个 ， 以 此 类 推 。 


你 没有 必要 实现 任何 的 逻辑 去 执行 一 个 查询 ， 或 者 做 映射 去 转换 结果 到 POJO 和 图 元 等 。SDN 为 你 做 了 这 一 切 。 


9.5.2 ”动态 派生 但 询 


下 


另 一 个 非常 简洁 的 不 需要 写 一 行 Cypher 代 码 就 能 够 用 于 定义 查询 的 方法 是 利用 动态 命名 查找 器 或 get methods 方 法 。 每 当 
SDN 遇 到 一 个 没有 显 式 @Query 注 释 的 在 知识 库 接口 定义 的 方法 ， 它 将 试图 基于 你 的 方法 的 名 字 动 态 创建 一 个 Cypher 查 询 。 


SDN 将 把 方法 的 名 字 分 解 为 与 元 模型 匹配 的 各 个 部 分 。 所 有 的 这 些 部 分 映射 到 定义 在 相关 域 实体 类 上 的 属性 。 


有 相当 多 的 可 用 选项 和 排列 ， 包 括 指定 顺序 的 分 类 、 指 定 荡 围 的 查询 、 请 求 不 同 的 结果 等 。 我 们 不 能 讲述 所 有 的 内 容 ， 但 是 


用 于 识别 动态 万 法 的 核心 规则 可 以 总 结 如 下 : 
任何 以 零 开 始 的 方法 或 以 fnd、tead、gpet 之 一 开始 的 方法 。 
“ 可 选择 地 跟着 任意 的 字母 和 数字 组 合 的 字符 串 。 
: 后 面 由 术语 By 跟着 〈 大 写 B) 。 


:后面 跟着 一 个 或 多 个 相关 域 实体 上 的 任意 属性 名 ， 属 性 名 的 第 一 个 字符 是 大 写 的 ， 多 个 属性 由 And 分 开 ， 或 其 他 比较 分 隔 
符 如 GreaterThan 或 Like。 


为 了 演示 在 实战 中 的 这 些 规则 ， 我 们 定义 了 一 个 新 方法 用 以 查找 具有 特定 名 字 的 任何 用 户 (例如 ， 查 找 所 有 的 Susan) 。 看 
一 看 程序 9-14 并 注意 UserRepository 接 口上 的 所 有 方法 的 定义 如 何 会 最 终 导致 完全 一 样 的 正在 生成 的 低层 Cypher 查 询 。 也 要 注 
意 由 于 具有 注释 查询 ， 与 方法 的 某 些 方面 相关 的 参数 变量 ， 在 这 种 情况 下 ， 是 代表 属性 名 字 的 部 分 。 


【程序 9-14】 ”动态 产生 的 查询 方法 


public interface UserRepository extends GraphRepository<User> | 


Iterable<User> name (String namel).,; 
Iterable<User;»s oetByName (Strindg namel).:; 
Iterable<User> getUserByNMame (String name).; 所 省 这 此 方法 解决 同样 产生 的 


Iterable<User»s readBvName (String namel). ee 要 
时 本 ‘S | ; 如 Cypher 查询 : 匹配 n-User 与 
lIterable<User> readUserByName (String namel.; 


nname 二 {0} 退回 了 了 


Iterable<User> findBvyName (String name).; 
Iterable<User> tindUserByName (String name).; 


四 注意 


如 果 你 想 看 一 下 SDN 为 你 的 方法 产生 什么 样 的 查询 ， 使 用 SLF4J 在 应 用 程序 中 改变 登录 级 别 以 进入 到 DEBUG.SDN， 因 此 ， 
任何 支持 SLE4J 的 框架 都 是 可 以 的 ; 样板 代码 中 使 用 Log4j 测 试 。 


像 以 前 一 样 ， 返 回 lterable 类 型 表示 对 SDN 期 待 着 多 个 可 能 的 实体 ， 而 一 个 单一 的 域 实体 表示 你 只 期 待 一 个 。 如 果 你 确实 曾 
经 指定 只 期 待 一 个 实体 ， 而 低层 查询 的 结果 多 于 一 个 ，SDN 将 会 跳出 一 个 以 下 种 类 的 异 单 。 


NoSuchElementException: More than cone element in IteratorWrapper (non-empty 
iterator) 


1. 多 重 和 府 入 式 属 性 

SDN 能 够 理解 相关 的 属性 定义 。 如 果 你 想 查 找 被 其 他 的 某 个 用 尸 ( 比 如 说 Susan) 推荐 的 所 有 用 户 ， 你 可 以 如 下 定义 一 个 方 
法 。 

Iterable<User»> findBvyvReferredBvyName (String name).; 


这 里 是 引用 用 户 的 referredBy 属 性 的 第 一 部 分 。 那 么 ， 由 于 这 个 属性 本 身 融 是 用 尸 类 型 ， 你 可 以 基于 那个 用 户 的 名 字 进 行 搜 
索 。 


你 应 该 把 所 有 的 属性 串 到 一 起 并 且 以 And 或 Or 把 它们 分 开 (现在 And 只 在 运行 时 支持 ) 。 假 设 你 的 用 己 也 有 一 个 年 龄 属 


性 ， 在 这 种 情况 下 ， 如 果 你 想 查 找 具 有 特定 年 龄 的 所 有 用 尸 ， 你 应 该 定义 一 个 这 样 的 万 法 : 
lterable<User> findByNameAndhAge (String name, 1int agel,; 


2. 更 多 信息 
这 么 简单 的 一 节 远 不 足以 介绍 所 有 可 用 的 查询 选项 ， 包 括 排序 、 查 询 范 围 和 通过 Neo4jTemplate 类 获取 的 一 般 查 询 方 法 。 
我 们 希望 我 们 已 经 给 出 了 使 用 这 类 查询 的 基本 模式 ， 使 你 能 够 接近 或 已 经 给 你 指出 了 在 这 条 路 上 应 该 选择 继续 的 努力 方向 。 


9.5.3 ”遍历 


我 们 再 一 次 发 现 我 们 不 能 涉及 所 有 的 内 容 ， 不 幸 的 是 ，SDN 内 部 的 遍历 是 我 们 不 能 深入 讨论 的 一 个 领域 。 然 而 ， 为 了 不 是 
一 点 也 不 涉及 ， 我 们 将 指出 你 在 第 4 章 中 遇 到 的 遍历 框架 也 可 以 在 SDN 中 访问 。 如 果 你 以 前 没有 猜测 到 这 一 点 ， 对 它 有 一 个 注 
释 ， 即 @GraphTraversal， 还 有 一 个 整体 知识 库 接口 (TraversalRepository) 专用 于 帮助 涉及 域 实体 的 遍历 。 


9.6 “本 童 小 结 


在 本 章 中 ， 我 们 介绍 了 Spring Data Neo4j (SDN) 框架 ， 这 个 框架 提供 了 允许 你 使 用 由 强大 的 Neo4j 数 据 库 支持 的 标准 的 基于 
POJO 的 域 模型 的 各 种 工具 。 你 看 到 了 以 一 种 允许 SDN 无 颖 地 照顾 到 域 模型 和 低层 图 元 之 间 的 映射 人 逻辑 的 方式 注释 一 个 POJO 是 多 


现在 你 学 会 了 如 何 使 用 Neo4j 模 板 和 知识 库 支持 的 实施 对 你 的 实体 做 CRUD1 和 索引 操作 ， 以 及 如 何 定 义 和 执 行 涉及 节点 实体 
的 查询 。 


你 也 了 解 了 两 个 主要 对 象 -图 形 映射 模式 : 简单 映射 模式 和 高 级 映射 模式 。 你 会 发 现 尽 管 两 者 最 终 做 的 事情 相同 ， 但 是 它们 
却 以 相当 不 同 的 方式 完成 ， 这 可 能 会 对 内 存 和 性 能 产生 影响 ， 这 需要 仔细 考虑 。 


就 像 我 们 在 9.1.4 节 中 所 说 的 ， 我 们 仅仅 能 够 对 SDN 的 功能 有 一 点 皮毛 的 了 解 。 我 们 希望 本 章 能 够 起 到 激发 你 的 探索 欲望 使 你 
能 够 继续 探讨 SDN 更 多 的 功能 。 接 下 来 ， 我 们 将 深入 理解 使 用 Neo 和 4 的 识 入 式 模 式 和 服务 器 模式 之 间 的 不 同 。 


[1] CRUD 是 指 在 做 计算 处 理 时 的 增加 (Create) 、 读 取 (Retrieve) 、 更 新 (Update) 和 删除 (Delete) 几 个 单词 的 首 字 母 简写 。 
主要 用 于 描述 软件 系统 中 数据 库 或 者 持久 层 的 基本 操作 功能 。 译 者 注 


二 部 分 “Neo4j 应 用 实例 


: 第 10 章 ”Neo4j 的 谈 入 式 模式 与 服务 器 模式 
第 11 章 ”Neo4j 的 架构 与 应 用 


在 本 书 的 前 两 部 分 ， 我 们 讲解 了 Neo4j 的 基础 知识 以 及 从 应 用 开发 的 角度 如 何 使 用 Neo4j。 


最 后 的 一 部 分 将 把 重点 转移 到 更 多 的 操作 型 的 领域 和 问题 ， 这 同样 需要 慎重 的 考虑 和 思考 。 本 部 分 只 有 两 章 , 但 是 涵盖 了 相 
当 多 的 基础 知识 ， 因 此 ， 准 备 好 开始 上 路 吧 ! 


第 10 章 探索 了 Neo4j 的 两 种 主要 使 用 模式 ， 谱 入 式 模 式 和 服务 器 模式 ， 了 解 使 用 每 一 种 模式 的 利 与 奖 。 本 书 的 大 部 分 把 重点 
放 在 了 谱 入 式 模式 ， 本 章 提供 了 如 何 使 用 特定 服务 器 功能 ， 例 如 插件 和 扩展 ， 当 以 这 种 模式 运行 时 充分 利用 Neo4j 的 指导 和 例 
子 。 第 11 章 通过 一 个 Neo4j 高 层 架 构 概 览 并 演示 如 何 扩 展 和 配置 Neo4j 使 之 高 度 可 用 ， 以 及 如 何 备份 和 恢复 Neo4j 数 据 库 来 结束 本 
书 。 


第 10 章 ”Neo4j 的 诅 入 陈 蛋 了 式 与 服务 器 模式 


本 草包 括 以 下 内 容 : 

` 两 种 主要 使 用 模式 : 座 入 式 模 式 和 服务 器 模式 
. 如 何 权衡 两 种 模式 的 利 与 苏 

“ 充分 利用 具有 Cypher、 插 件 、 扩 展 和 流 的 服务 器 


既然 你 已 经 有 了 对 设计 和 建 模 Neo4j 图 形 数据 库 所 需 的 万 法 和 实际 扩 术 的 很 好 理解 ， 现 在 残 可 以 看 看 Neo4j 的 两 种 主要 运行 
模式 了 ， 那 就 是 嵌入 式 模 式 和 服务 器 模式 。 在 着 手 任何 的 重要 Neo4j 项 目 之 前 ， 第 一 件 需要 考虑 的 事情 是 决定 最 终 要 以 什么 模式 
运行 Neo4。 这 一 选择 将 影响 到 许多 因素 ， 辟 如 你 的 应 用 程序 将 用 什么 语言 和 在 什么 环境 下 运行 ， 因 此 这 是 一 项 非常 重要 的 考虑 


你 将 会 很 高 兴 的 知道 ， 不 管 你 选择 的 是 什么 模式 ， 到 目前 为 止 你 已 经 学 到 的 知识 仍然 适用 。 使 用 每 一 种 模式 的 句法 非常 不 
同 ， 理 解 这 些 句法 和 如 何 适 当 的 使 用 它们 是 很 重要 的 ， 但 是 核心 的 原理 还 是 一 样 。 


在 本 章 中 ， 我 们 将 讨论 为 什么 会 有 两 种 模式 ， 它 们 的 主要 区 别 是 什么 ， 如 何 权衡 ， 优 点 缺 挟 以 及 使 用 每 一 种 模式 的 影响 。 现 
在 让 我 们 开始 学 习 模 式 吧 ! 


10.1 使 用 模式 概述 


当 Neo4 第 一 次 友 布 时 ， 它 的 目标 束 是 针对 基于 Java 的 领域 ， 所 以 只 是 支持 虞 入 式 模 式 。 在 蔚 入 式 模 式 的 设置 中 ， 你 的 Java 
应 用 程序 和 全 新 闪 亮 的 Neo44 数 据 库 很 友好 地 缕 在 一 起 作为 单一 的 应 用 实体 ， 共 同 去 征服 基于 图 形 问题 的 新 领域 。 


然而 ，Neo4 的 广泛 能 力 和 功能 并 没有 被 其 他 的 语言 所 忽视 ， 这 些 功能 也 感 兴趣 于 能 够 起 到 杠杆 作用 和 充分 利用 这 一 全 新 的 
图 形 数据 库 。 尽 管 Neo4j 是 用 java 语言 写成 的 ， 但 其 本 质 上 是 一 个 基于 JVM 的 产品 。 这 意味 看 理论 上 任何 基于 JVM 的 语言 (假设 
能 找到 或 编写 合适 的 库 或 绑 定 ) 也 能 够 使 用 Neo 浊 数据 库 。 因 此 ， 由 于 不 同 的 库 和 绑 定 开始 涉及 并 成 为 可 用 ，Neo 才 的 应 用 乞 转 
目 然 地 开始 扩展 到 其 他 基于 JVM 的 语言 。 但 是 ， 以 网 络 更 友好 的 结构 运行 是 必需 的 ， 引 进 服 务 器 模式 背后 的 主要 驱动 因素 是 对 
支持 其 他 非 基 于 JVM 的 客 尸 的 需求 。 在 服务 器 模式 下 ，Neo4j 数 据 库 以 目 己 的 进程 运行 ， 客 尸 端 通过 它 的 专用 基于 HTTP 的 REST 
API 与 其 对 话 。 


图 10-1 给 出 了 这 两 种 使 用 模式 和 不 同 客户 通过 这 些 模式 使 用 Neo4j 的 主要 方式 的 概况 。 


太 甸 上 的 j et 和 A Me 
服务 此 质 季 市 展 或 增 旦 | ] 


最 具 荐 时 于 Java 核 有 en es 堪 托 下 的 扩展 仅仅 古 

封套 , 当 需 要 时 就 会 代表 基于 RESTAAPI 的 可 用 这 名 自 定 义 暴 圳 HTTP 关 
人 一 一 | = 号 本 
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i mn ee mn es mm en ee mm ee es ee 


@ 和 是 拱 合用 本 机 的 拱 入 式 Neo4j aa 
全 过 特定 的 溢 入 式 Neodj 杠 单 / 部 定 获 得 的 Neo4j 交 
© 直接 使 用 坊 心 Neo4j HTTP REST API 


前 过 一 个 支持 的 远程 REST 客户 端 API 交互 


i 


5 通过 Neodj 非 托 管 扩展 交互 ( 月 定 祥 暴露 HTTP 结 素 端 , 见 10.54 节 
图 10-1 Neo4j 使 用 模式 和 客户 端 用 户主 要 集成 选项 的 概况 


在 嵌入 式 模式 中 ， 任 何 能 够 在 JVM 中 运行 的 客户 端 代 码 都 能 在 Neo4j 中 使 用 。 就 像 图 10-1 所 演示 的 ， 你 可 以 以 纯 Java 客 户 端 
直接 使 用 嵌入 式 模式 ( @) ， 这 里 是 直接 使 用 核心 Neo4j 库 ， 或 间接 通过 由 不 同 社区 提供 的 基于 JVM 语 言 的 额外 特定 语言 绑 定 和 
框架 (@) 。 


在 服务 器 模式 中 ， 客 户 端 代码 通过 HTTP 协 议 ， 尤 其 是 通过 明确 定义 REST API 与 Neo4j 服 务 器 交互 ， 对 于 REST API， 还 有 额 
外 的 可 用 选项 ， 当 需要 时 可 以 扩展 REST 功 能 。 这 个 API 可 以 被 任何 支持 HTTP 的 客户 端 直接 使 用 ( 合 ) ， 或 为 了 使 得 开发 的 工作 
变 得 更 轻松 一 点 ， 可 以 使 用 各 种 不 同 语言 和 框架 可 用 的 远程 REST 客 户 端 AP| (全) 。 随 着 服务 器 模式 引进 的 固有 网 络 延迟 ， 访 问 
数据 库 的 性 能 自然 不 如 直接 使 用 本 机 代码 。 为 了 给 服务 器 模式 的 服务 添加 更 大 的 灵活 性 ， 可 以 使 用 服务 器 插件 和 非 托管 扩展 (人 @ 
) 加 强 其 性 能 和 功能 。 我 们 将 在 本 章 的 后 面 讲解 服务 器 插件 和 扩展 。 


四 注意 


到 目前 为 止 本 书 中 你 看 到 的 所 有 例子 中 的 代码 使 用 的 都 是 谱 入 式 模式 的 设置 。 座 入 式 模式 是 实验 Neo4j 的 一 种 非常 好 的 方 
法 ， 它 也 经 常 被 用 于 探索 Neo4j 能 够 做 什么 。 即 使 你 决定 使 用 服务 器 模式 ,仍然 有 机 会 在 服务 器 本 身 使 用 本 机 的 API， 并 且 有 时 
候 可 能 是 更 必要 的 。 另 外 ，REST API 经 常 仅仅 为 本 机 的 谈 入 式 API 提 供 一 个 门面 ， 知 道 并 理解 座 入 式 API 的 工作 原理 会 是 非常 有 
用 的 。 理 解 训 入 式 的 语义 和 选项 将 会 给 你 很 大 的 帮助 以 获得 设置 的 最 大 益处 ， 即 使 你 选择 的 是 基于 服务 器 模式 的 设置 。 


10.2” 诅 入 陈 候 式 


到 目前 为 止 我 们 看 过 的 所 有 例子 都 是 使 用 众 入 式 模 式 ， 因 此 ， 我 们 首先 深入 探讨 这 种 模式 也 是 很 合理 的 。 需 要 说 清楚 ， 外 入 
式 模 式 并 不 是 指 硬 盘 上 的 实际 物理 数据 库 丛 入 到 你 的 应 用 程序 中 ， 而 是 误 入 到 Neo4j 引 警 (类 和 相关 的 过 程 ) 直接 运行 和 管理 
Neo4j 数 据 库 。 


10.2.1 核心 Java 集 成 


最 通用 的 嵌入 式 情景 涉及 在 一 个 基于 Java 的 应 用 中 直接 嵌入 Neo 和 ， 如 图 10-2 所 示 。 


打包 的 和 在 你 的 应 用 程序 内 运行 的 核心 Neo4 类 比 仅仅 作为 在 物理 数据 仓储 和 你 的 应 用 程序 之 间 前 前 后 后 做 数据 传送 的 一 种 
机 制 的 作用 大 。 类 本 身 构 成 了 集成 整个 数据 库 功 能 的 一 部 分 并 提供 管理 ， 例 如， 所 有 的 逻辑 和 做 遍历 、 查 询 等 的 内 存 需 求 。 从 应 
用 程序 结构 的 角度 看 ， 这 是 非常 有 趣 的 ， 因 为 这 意味 着 风 辑 控制 你 的 应 用 程序 以 及 数据 库 需要 能 够 在 同一 个 JVM 空 间 协调 一 
致 。 这 种 在 一 起 的 影响 将 在 10.4 节 讲解 ， 但 是 现在 知道 诅 入 式 模式 意味 看 你 的 应 用 程序 和 和 Neo4j 代 码 将 会 驻 留 和 运行 于 同一 个 
JVM 融 足够 了 。 


嵌入 式 模 式 需要 适当 的 库 (JAR 文 件 ) 捆绑 或 当 应 用 程序 开始 时 你 的 应 用 程序 可 用 这 个 库 。 然 后 ， 通 过 实例 化 
GraphDatabasesService 接 口上 的 适当 实例 获得 对 库 的 访问 后 ， 束 该 由 你 的 应 用 程序 负责 了 。 然 后 ， 你 的 应 用 程序 惑 能 够 利用 这 


个 引用 与 Neo4 和 交互， 通过 到 目前 为 止 我 们 已 经 讨论 过 的 所 有 APIl。 通 常 对 单机 设置 使 用 EmbeddedGraphDatabase 类 。 高 可 用 
性 (HA) 将 在 第 11 草 介绍 。 
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图 10-2 ”典型 的 Java 谱 入 式 部 署 方案 ， 这 里 Neo4j 库 底 入 到 Java 应 用 程序 中 
.需要 的 库 


如 果 你 是 在 项 目 中 使 用 Maven (http://maven.apache.org) ， 下 面 的 程序 给 出 了 所 有 必须 导入 到 你 的 应 用 程序 中 的 适当 
的 丛 入 式 Neo4j 库 。 


【程序 10-1】 姐 入 了 式 Neo4j 依 赖 


<dependency> 
roupId>org.neoaij</groupId> 人 嵌入 式 开 发 所 需 的 
<artifactIid>neo4j-community</artifactId> ” “主要 依 环 
VErISl1ON>2.0,l1<Vverslion> 

</ dependency> 

<dependency> 
<gqroupIdsorg.neo4j</groupId> 
<aartiftactlid>neo4] -kernel</artitactIid> 竺 辅助 单元 测试 有 
<VErSions2.0.1</versions A 


| 划 测 这 使 未 
<tvypestest-] 有 上 < 人 Ye > 用 的 测试 依 匡 


<ScCope>teste/ ScoOPpe> 
</ dependency> 


Maven 将 确保 所 有 需要 的 依赖 作为 传递 依赖 管理 系统 的 一 部 分 下 载 下 来 (人 @) 。 换 句 话说 ，Maven 将 会 知道 除 主 Neo4j 库 
外 的 那些 需要 下 载 的 其 他 支持 库 并 确保 这 些 是 可 获取 的 。 


如 果 不 使 用 Maven， 你 将 会 需要 从 Neo4j 网 站 上 下 载 合适 的 zip/ 压 缩 包 (zip/tarball) 并 在 lib 目 录 下 提取 必要 的 库 。 下 一 段 
程序 显示 了 Maven dependency: tree 的 执行 结果 (@) ， 显 示 了 当 你 请 求 核心 嵌入 式 库 时 ，Maven 会 下 载 哪些 额外 的 库 。 


【程序 10-2】 核心 Neo4j 刻 入 式 库 的 依赖 树 


[INFO] --- maven-dependency-plugin:2.8:tree (default-cli) @ chapterl0- 


embedded --- 
[INFO] neoc4ij-in-action:chapterl0-embedded: jar:d0.1.1-SNAPSHOT 
[INFO] +- org.neod4j]:neodj-community:jar:2.0.1:compile < 
[INFO] | +- org.neo4j:neo4j-kernel:jar:2.0.1:compile 对 上 应 锥 序 10-1 
[INFO] | +- org.neo4j:neo4j-lucene-index:jar:2.0.1:compile 中 四 的 依赖 树 
[INFO] | | “- org.apache.lucene:lucene-core:jar:3.6.2:compile 
[INFO] | +- org.neo4j:neo4j-graph-algo:jar:2.0.1:compile 
[INFO] | +- org.neo4ij:neo4j-udc:jar:2.0.1:compile 
[INFO] | +- A ia 0.1;:compile 
[INFO] | +- org.neo4j:neo4j-cypher:jar:2,0.1:compile 
[INFO] | | +- org.neocd4j:neo4j-cypher- ee 
[INFO] | | +- org.neoc4j:neo4j-cypher-compiler-1.9:jar:2.0.1:;compile 
[INFO] | | +- Org.neoc4j:neo4j-cypher-compiler-2.0:jar:2.0.1:compile 
[IINFO] | | | ‘\- org.parboiled:parboiled-scala 2.10:jar:1.1.6:compile 
[IMNFO] | | | \- Org.parboiled:parboiled-core:jar:1.1.6:compile 


[IINFO] | | +- com.googlecode.concurrentlinkedhashmap: 
concurrentlinkedhashmap-lru:]ar:1.3.1:compile 


[INEO] | | ‘\- org.scala-lang:scala-library:jar:2.10.3:compile 

[INFO] | =- org.neo4j :neo4j-jmzx:jar:2.0.1:compile 

[INFO] += org.neod4j:neo4j-Kkernel:test-Jar:tests:2.0.1:test 

[INFO] | “- org.apache.geronimo.specs:geronimo- 对 应 程序 10-1 
jta 1.1 spec:jar:l.1.1:compile 中 二 的 依 束 树 

[INFO] +- 

2. 获 得 对 从 入 了 式 Neo4j 数 据 库 的 访问 


假设 你 已 经 有 了 代码 所 有 需要 的 依赖 ， 下 一 段 程序 详细 地 襄 明 了 如 何 获 得 藤 入 式 数 据 库 的 引用 ， 并 且 该 段 程序 也 负责 提供 一 
个 确保 当 JVM 退 出 时 数据 库 恰 当天 闭 的 一 个 机 制 。 


【程序 10-3】 ”开始 和 关闭 一 个 馈 入 式 图 形 数 据 库 


private String DE PATH = '/var/data/neo4jdb-private'! 

private GraphDatabaseService graphdb = 

new GraphDatabaseFactory!() .newEmbeddedDatabase! DB PATH ) ; < 
registerShutdownHook{( graphDb )}; 创建 一 个 嵌入 式 数 据 


库 ， is 
于 DBE_BPATH。 
private static void reglisterSshutdownHook( 
final GraphDatabaseSdService graphDb )} 


| 


Runtime .getRuntime()} .addSshutdownHook!( new Thread'!) < i et 
( 注册 一 个 关闭 点 确保 当 JVM 进 
Override 出 时 ， 执行 一 个 御 捕 的 去 财 。 
Public volid run!() 
{ 


graphDb .shutdown(); 


| 7); 


当 你 的 应 用 程序 退出 时 ， 确 保 Neo49 彻 底 天 闭 是 非常 重要 的 。 在 完成 前 即使 你 友 送 一 个 键盘 中 断 信 号 (Ctrl-C) 试图 终止 进 
程 ， 程 序 10-3 中 的 关闭 数据 库 代 码 (人 @) 也 会 被 触发 。 


未 能 彻底 天 闭 数 据 库 将 导致 下 次 局 动 时 出 现 问题 。Neo4j 能 够 探测 出 没有 彻底 天 闭 并 试图 恢复 ， 这 将 会 导致 恢复 进程 中 非常 


慢 的 初始 化 局 动 ， 有 时 也 会 导致 出 现 其 他 的 问题 。 当 一 个 不 彻底 的 关闭 发 生 时 ， 下 面 的 警告 信息 将 会 在 数据 库 下 一 次 的 局 动 日 志 
中 看 到 : 探测 到 未 彻底 的 关闭 (non clean shutdown detected) 。 


3. 芯 入 式 模 式 测 试 


测试 是 任何 软件 开 友 的 重要 组 成 部 分 。 本 书 和 本 书 中 详细 介绍 的 大 部 分 代码 都 已 经 过 单元 测试 ， 并 在 不 同 草 节 的 情景 中 得 到 | 
证 实 和 演示 。 在 许多 情况 下 ， 这 些 测试 使 用 一 个 非常 方便 的 内 存 数据 库 实施 
(org.neo4j.test.ImpermanentGraphDatabase) ， 这 是 专门 为 单元 测试 设置 的 。 


在 测试 Neo4j 核 心 库 中 可 以 找到 ImpermanentGraphDatabase 类 (程序 10-1 中 的 @) 。 以 嵌入 式 数 据 库 (参见 程序 10-3 


的 @) 使 用 Neo4j 会 使 物理 节点 和 关系 存 到 了 硬盘 。 然 而 ， 使 用 非 永 久 备份 数据 存储 的 Neo4j 将 导致 只 在 内 存 中 存储 数据 而 不 保 
和 存 到 文件 系统 中 。 强 烈 鼓 励 进 行 Neo4j 代 码 单元 测试 ， 而 且 这 个 ImpermanentGraphDatabase 实 施 提供 了 一 个 奇妙 的 方法 做 测 


试 或 证 实 你 的 问题 领域 里 的 一 毕 图 形 场景 。 


10.2.2 ”其 他 基于 JVM 的 集成 


Neo4j 社 区 拥有 一 大 群 各 式 各 样 并 且 积 极 的 成 员 ， 并 且 他 们 早已 经 看 到 了 很 多 语言 和 框架 绑 定 以 嵌入 式 模式 用 其 他 语言 使 用 
Neo4j， 例 如 Scala、JRuby 等 。 这 通常 是 通过 语言 指定 封装 完成 的 ， 这 个 语言 指定 能 够 通过 问题 中 的 JVM 语 言 和 框架 将 Neo4j 核 
心 API 改 编 为 能 用 于 本 机 的 AP| (在 某 些 情况 下 是 惯用 的 ) 。 图 10-3 给 出 了 这 些 应 用 场景 通常 涉及 的 情况 。 
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J vi 


你 的 (Scala/Ruby/X ) 应 用 


Neo4j 库 


Scala Rubwx 
理 言 封套 / 
有 入 起 驯 动 
仁太 


| GraphDatabaseService 


一 二 人 和 对 


图 10-3 ”其 他 包括 语言 指定 封套 和 Neo4j 了 驱动 程序 的 基于 JVM 的 庶 入 式 部 署 方法 


重要 的 是 这 些 封装 的 大 多 数 仅 仅 是 在 基于 Java 的 Neo4j 类 和 API 的 前 面 有 效 。 这 意味 着 所 有 的 属性 和 与 基于 Java 的 嵌入 式 版 
本 也 会 通 单 适用 基于 封装 的 实施 ， 对 于 封装 库 本 身 引 进 的 额外 特点 也 需要 进行 考虑 。 


一 个 可 用 的 最 新 语言 封 玫 列表 可 以 参阅 http://neo4j.org/drivers/。 在 本 书写 作 时 ， 这 个 列表 包括 JRuby、Django、 
JavaScript、Scala 和 Clojure。 


这 残 是 我 们 对 误 入 陈 模 式 如 何 工作 和 使 用 诅 入 陈 模式 的 需求 的 切 步 探讨 。 在 我 们 转移 到 得 看 服务 器 模式 的 权衡 、 优 点 和 缺 点 
之 前 ， 接 下 来 我 们 将 以 相似 万 法 探讨 服务 器 模式 的 性 能 和 工作 情况 。 


10.3 ”服务 器 模式 


与 从 入 陈 异 了 式 不 同 ， 以 服务 器 蛋 式 运行 Neo4j 涉 及 要 访问 和 处 理 的 所 有 类 和 逻辑 都 与 包含 目 身 专 用 济 程 且 完 全 与 使 用 它 的 客 
户 疾 分 离 的 Neo4 数 据 库 交互 。 如 与 许多 其 他 的 基于 服务 器 的 设置 ， 客 户 站 需 要 有 某 个 机 制 与 服务 器 沉 程 进行 交互 ， 在 Neo4j 的 情 
况 下 ， 这 是 通过 使 用 明确 定义 的 ， 然 而 是 可 扩展 的 基于 HTTP 的 REST API 获 得 的 。 


REST 是 什么 


REST 有 时 可 看 作 有 一 点 超 负 答 的 术语 ， 但 它 正 式 代表 的 是 表述 性 状态 传递 。 简 而 言 之 ， 它 可 以 被 认为 是 一 种 软件 架构 风 
， 拥 有 和 利用 了 网 络 操作 方法 和 网 络 结构 ， 在 大 多 数 情况 下 使 用 HTTP 作 为 选择 的 运输 工具 来 帮助 实现 这 个 。 对 于 REST 的 完 
理论 定义 和 解释 ， 参 阅 Roy Fielding 的 博士 论文 ，“ 结 构 风 格 和 基于 网 络 的 软件 结构 设计 (2000 年) ， 这 里 是 这 个 概念 的 原始 提 

出 和 首先 出 版 的 地 方 (www.ics.uci.edu/~fielding/pubs/dissertation/top.htm) 。 


总 地 来 说 ， 无 论 是 从 用 户 的 角度 导航 他 们 还 是 从 服务 器 和 它们 背面 的 支持 结构 来 看 ， 网 页 和 人 们 进行 交互 的 方式 遵循 一 个 一 
致 的 模式 。 作 为 一 个 用 户 ， 你 通过 提供 URL 请 求 网 页 (资源) 。 这 些 网 页 后 来 随 着 你 请 求 的 数据 返回 ， 还 有 另外 的 指向 其 他 数据 
或 相关 资源 的 链接 。 服 务 器 理解 HTTP 获 取 数 据 的 GET 请 求 以 及 修改 和 创建 新 资源 的 请 求 (POST 和 PUT) 。 简 单 地 说 ，Fielding 
提出 这 些 相同 的 原理 可 以 用 于 同 更 一 般 的 资源 的 交互 ， 例 如 ， 那 些 由 应 用 程序 提供 的 服务 (在 这 里 是 指 读 网 页 服务 ) 。 因 此 ， 如 
果 它 们 是 为 利用 这 些 原理 帮助 网 页 发 展 成 今天 的 这 个 样子 而 设计 的 ， 这 些 网 页 资源 也 可 能 是 人 或 系统 通过 一 致 的 和 可 预测 的 方式 
提供 、 隆 航 和 交互 的 。 


类 似 RESTful 的 网 页 服务 (例如 ， 相 对 于 SOAP) 或 许 是 事实 上 的 当今 网 页 服务 实施 ，Neo4j 也 可 以 算 作 它们 当中 的 一 
Neo4j 的 REST 实 施 使 用 了 JSON 作 为 默认 的 数据 格式 并 提供 了 一 个 面向 服务 的 方式 与 Neo4j 资 源 (节点 与 关系 ) 交互 及 操作 。 


关于 这 一 课题 的 更 多 信息 和 务实 处 理 方 式 ， 参 阅 Jim Webber、Savas Parastatidis 和 Ian Robinson 的 《REST in Practice》。Jim 


Webber 在 Neo4j REST API 的 设计 与 开发 中 做 出 了 非常 大 的 贡献 。 


10.3.1 ”Neo4j 服 务 器 概述 


图 10-4 描 述 了 涉及 具有 一 个 以 标准 的 、 随 手 就 用 的 REST API 访 问 的 ， 并 以 服务 器 模式 运行 的 Neo4j 核 心 部 件 。 


a 
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图 10-4 ”一 个 典型 的 具有 通过 标准 的 REST API 访 问 客户 端的 Neo4j 服 务 器 设置 


Neo4j 服 务 器 本 身 只 是 一 个 基于 JVM 的 应 用 。 在 后 面 它 通 过 封 疼 适当 的 Graph-Database9ervice 接 口 
(EmbeddedGraphDatabase 或 HighlyAvailable-GraphDatabase) 实例 提供 它 的 功能 ， 这 些 功能 通过 一 个 恨 好 定义 的 接口 显 
示 给 外 部 的 用 户 。 


为 了 能 够 侦 听 和 与 对 服务 器 请 求 的 REST 人 交互， 所 有 的 Neo 有 服务 器 实例 将 会 局 动 一 个 散 入 陈 网 页 服务 器 (当前 默认 的 是 一 
个 Jetty 服 务 器 侦 听 ， 在 端口 7474) 。 


1. 安 装 和 使 用 Neo4j 服 务 器 


要 安装 Neo4j 服 务 器 ， 你 需要 下 载 适 合 你 的 操作 系统 的 tar 或 zip 文 件 ， 先 解压 ， 然 后 利用 操作 系统 指定 的 脚本 语言 开始 和 结 
束 服 务 器 。 附 录 A 详 细 介绍 了 安 和 妆 的 各 个 步骤 。 


从 客户 器 的 角度 看 ， 你 不 需要 任何 指定 的 Neo4j 库 。 只 要 你 能 太 送 HTTP 请 求 ， 融 足够 了 。 如 果 你 是 在 UNIX 环 境 ，curl 客 户 
剖 将 会 为 你 做 这 些 。 然 而 ， 本 机 的 REST APl 是 非常 详细 的 ， 往 往 不 是 你 想 要 的 一 些 客 尸 端 库 并 通过 注意 一 些 更 普通 的 低层 REST 
映射 使 得 你 的 工作 更 容易 一 些 。 使 用 合适 的 远程 API 库 (10.3.4 节 的 列表 ) 能 够 在 这 方面 给 你 很 大 的 帮助 。 


2.curl 和 和 Java 客 户 端 例子 
本 章 提 供 了 使 用 两 种 不 同 客户 冰 的 例子 : 
` 在 大 部 分 UNIX 分 布 操作 系统 中 ， 可 以 使 用 cutl 命 令 。 这 种 客户 端 将 会 演示 如 何 直接 调用 低层 次 的 REST API。 


Java 客户 端 使 用 官方 的 绑 定 到 服务 器 的 REST API 上 的 Neo4j Java REST (neo4j-rest-graphdb) 。 这 一 选项 显示 了 如 何 使 用 一 


个 远程 客户 端 库 简化 用 于 Neo4j REST API 的 代码 。 
再 一 次 的 ， 如 果 你 使 用 Maven， 下 面 的 程序 可 以 加 到 pom.xml 文 件 中 以 调 入 适当 的 库 。 


dependency»> 
<roupIlId>org.neodi</grouplds 
<art1ifactIdsneod4]-rest-g9raphdb</artifactlds 
<VErsSlions2.0.1</Vversions 


</dependency> 


10.3.2 ”使 用 细 粒 度 Neo4j 服 务 器 模式 的 REST AP 


原始 细 粒 度 Neo4j REST API 的 设计 是 从 低 痕 到 超 媒 体 驱动 以 及 到 你 使 用 它 的 不 同方 面 残 能够 “发 现 ” 它 。 每 一 个 仪 以 很 少 
信息 量 请 求 结 果 的 返回 ， 都 以 嵌入 式 的 连接 提供 获得 更 多 信息 的 机 制 。 所 有 REST API 的 部 件 都 能 探测 或 获取 的 开始 URL 
是 http://<domain-name>:<port>/db/data。 有 了 时 称 它 为 服务 的 根 目 录 (service root) 。 因 此 ，Neo4j 服 务 器 运行 于 局 域 主 
机 上 ， 在 默认 的 端口 7474， 将 会 有 一 个 服务 根 目 录 进 入 点 http://localhost: 7474/db/data。 


下 面 的 程序 给 出 了 一 个 请 求 所 使 用 的 数据 和 服务 根 目 录 的 相关 响应 。 


【程序 10-4】 ”HTTP 服务 根 目 录 的 请 求 与 响应 


HTTP Request | 服务 根 目 录 URL 对 所 有 的 REST 请 求 ， 
GET http://localhost:7474/,db/data/ < 如 果 期 待 包 得 数 据 的 
Accept: application/json 响应 显 去 的 设 胃 


对 所 有 的 REST 请求 ， 


Content-Type: application,]json 之 ce ed 
获取 系统 伟 和 。 如 果 需 要 发 送 数据 , 显 | accept 为 JSON 
统 案 引 节 扣 ee 式 的 设置 Content- 
信息 的 基础 NH mme Tar 
和 Content-Type: application/json IYPe A JSON 
REST URL 
| 获取 系统 节点 信息 的 基础 
nextensions" : { }; REST URL 
"mnode®™ : "http://localhost:7474/db/data/node", 
"node index" ; "http://localhost: aTh db AaLa /Eid 
"relationship index" : "http://localhost:7474/db/data/index/relationship', 


extensions info" :; "http://localhost:7474/db/data/ext", 
"relationship types" :; "http://localhost:7474/db/data/relationship/types!', 


技 行 基于 - bateh" : OR OA Re se 执行 基于 REST 
REST 批 中 "Cypher" : "EE 2 OO De TET a yen < 的 Cypher 查 询 
SS "indexes”" : "http://ocalhost:7474/db/data/schema/index", 
睾 功能 的 "constraints" : "http://localhost:7474/db/data/schema/constraint', 的 完整 URI 
完整 URL "transaction" :; "http://localhost:7474/db/data/transaction", 

"node labels" : "http://localhost:7474,db/data/labels", 

"neo4] Vversion™. : "2.0.1" 

| 获取 系统 标签 和 模式 索引 节点 信息 的 基础 REST URL 


因为 通过 标准 的 HTTP 协 议 能 够 访问 REST， 现 在 所 有 类 型 的 客户 端 都 可 以 照顾 到 ， 而 不 是 那些 仅仅 能 够 使 用 VM 的 客户 端 。 
下 面 的 程序 演示 了 标准 的 UNIX curl 客 户 端 产生 的 HTTP 请 求 ， 请 求 的 响应 在 程序 10-4 中 一 一 详细 列 出 。 这 上段 代码 包括 设置 所 有 
需要 的 头 函 数 。 

CUrl -其 GET -H "hccept: applicaticon/json" -H "Content-Type: application/json" 


http://localhost:7474/db/datal 


假如 你 想 从 一 个 特定 的 起 始点 探索 第 9 草 中 的 社交 网 络 图 形 数 据 库 ， 例 如 ， 获 得 更 多 的 关于 Adam (系统 中 具有 用 户 编号 为 
adam001 的 示例 用 户 ) 的 信息 。 你 首先 需要 识别 你 的 起 始 REST URL， 知 道 系 统 中 的 用 户 是 用 他 们 的 用 户 编号 索引 的 。 使 用 程序 
10-4 作 为 我 们 的 起 始点 ， 如 果 你 是 使 用 传统 的 索引 ， 你 可 以 使 用 对 node_index (人 @) 键 详尽 的 基础 URL 作 为 起 始点 构建 需要 查 
找 Adam 的 最 终 URL。 使 用 基于 模式 索引 ， 你 将 需要 使 用 node_labels (@) 键 构建 一 个 URL。 每 一 步 的 请 求 与 相关 的 响应 显示 


在 下 面 的 程序 中 。 
【程序 10-5】 ”通过 他 的 userld 获 取 Adam 信 息 的 HTTP 请 求 与 响应 


Legacy Index HTTPF redgquest 

GET http://localhost:7474/db/data/index/node/userids/userId/adamd001 
Accept: application/json 

Label based index HIIPE Recquest 

GET http://localhost:7474/db/data,label,/Person/nodes?userId=%22adam001%22 
Accept: application,/]json 


HTTP Response (partial response shown) 
0: OK 
Content-Type: application;json 代表 和 和 能够 用 于 性 取 这 个 市 后 ( 审 后 编号 为 0) 
基础 水 平 信息 的 URIL 


共 取 与 这 个 移 ;io ,1 
"EXteETISl1ONS :1: 41 » . .1， 

此 i- + 村 | L ? 

到 外 这 的 1 人 TV 

所 有 去 有 系 芍 "property" : "http://localhost:7474/db/data/node/0/properties/{(keyl}", 

更 名 信息 的 rgelfn" 

[JRE "http://localhost:7474/db/data/node/0"., 


"all relationships" 
"http://localhost:7474/db/data/node/0/relationships/all", 


ndata™ ; | 和 节点 的 数据 ， 详 细 描 述 了 基于 这 
和 把 


userId" : "adam001"., 个 首 的 所 有 属性 (和 例 你 键 值 对 ) 


name" +: Adarm”™ 


这 一 响应 表示 了 返回 的 节点 Adam 碰 巧 与 编号 为 0 (人 @) 的 节点 相关 。 它 也 包括 与 这 个 节点 相关 的 所 有 属性 ( 合 ) 。 如 果 你 
想 探 索 这 个 节点 的 出 和 进 的 关系 ， 将 需要 另 一 个 调用 。 可 以 使 用 与 all_relationships (人 @) 相关 的 URL 取 回 这 组 信息 ， 其 响应 如 


下 面 的 程序 所 示 。 


【程序 10-6】 ”相对 于 Adam 的 所 有 关系 的 HTTP 请 求 与 啊 应 


Logical HTTP Regquest 
SET http://localhost:7474/db/data/node/0/relationships/all 
Accept: application/]json 


HITP Regponse 


人 2 日: 人 DK 
Content-Type: application/ijson 


下 是 rstart" : "http://localhost:7474/db/data/node/0", 


对 每 一 个 返回 的 | 
基 系 5 等 己 请 1 | ] 
ER property" : "http://localhost:7474/db/data/relationship/ss9/properties/ 
用 户 提供 了 数据 人 
KeY | 
和 和 连接 的 温 合 人 情 self" : "http://localhost:7474/db/data/relationship/599", 
时 因此， 用户 mroperties" : "http://localhost:7474/db/data/relationship/599/properties", 
可 以 发 现 贡 于吉 type” ;: “TS Ee 
extensions . 
疑问 特定 关系 的 要 _ 
利 考 各 由 end" : http://localhost:7474/db/data/node/é00 
FE 


利用 这 些 响应 ， 你 可 以 按 需 求 用 另外 的 调用 继续 探索 或 友 现 这 个 图 形 数 据 库 。 尽 管 这 种 探索 方式 在 REST 背 后 的 核心 原理 保 
寺 快 速 ， 但 是 它 也 使 基本 细 粒 度 REST API 成 为 一 般 需 要 多 网 络 的 请 求 来 满足 基本 的 图 形 查 询 ， 这 
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并 不 预示 着 性 能 会 好 。 在 下 面 的 几 节 中 ， 你 将 会 看 到 什么 样 的 方法 能 用 于 减少 对 话 的 次 数 ， 但 是 你 现在 应 该 对 核心 REST APl 是 
如 何 设计 的 和 功能 有 一 个 基本 的 理解 。 


10.3.3 ”使 用 Cypher Neo4j 服 务 器 模式 REST API 端 点 


你 能 够 在 大 多 的 情况 下 使 用 Cypher REST 详 点 获得 像 客户 站 用 户 从 各 种 不 同 细 粒 度 REST API 调 用 获得 同样 的 结果 ， 且 具有 
更 少 的 网 络 跳跃 和 更 多 的 控制 。 正 像 你 继续 往 前 将 会 看 到 的 ， 非 常 敦 励 使 用 Cypher 作 为 一 种 减少 调用 对 话 次 数 的 万 法 。 


下 面 的 程序 显示 了 如 何 能 够 通过 REST API 执 行 一 个 Cypher 查 询 ， 并 在 一 个 调用 中 获得 Adam 的 节点 基本 信息 及 Adam 所 有 
天 系 的 列表 一 一 相对 于 前 一 节 演 示 的 原始 细 粒 度 API 的 两 个 独立 的 调用 。 


【程序 10-7】 ”通过 REST API 使 用 Cypher 获 得 Adam 信 息 ， 包 括 所 有 的 关系 


Lodgical HTTP Reduest 


POST http://localhost:7474/db/data/cypher 1 
Accept: application/ijson; charset=UTF-8 | 执行 Cypher 查询 的 REST API 
Content-Type: application,/ijson 
{ "query™ : < 
"MATCH 执行 Cypher 查询 
( x:Ferson { userId: { uId } } }-[r]-/() 
RELUREN 


xX 如 adam node ， 
collect (r} as adam rels", 


"parames”" : A 
{| "uuId" : "adam00l" 1 | 可 莽 数 中 的 值 


HTTPF Partial Response 
UU: OR 
Content-Type: application/json 


"colummas”" : [| "adam node", "adam relJs" ],， 
Hrdjata" 
[ { // SAME AS CONTENT FROM LISTING 10.5 ] ， 
[ J// SAME LAS CONMNTENT FROM LISTING 10.6 ] 


使 用 Cypher 新 点 的 好 处 是 能 够 在 单一 的 执行 中 聚集 和 整合 需求 的 数据 ， 而 不 需要 通过 多 个 独立 的 网 络 调用 。 尽 管 程序 10-7 
返回 了 原始 节点 和 关系 的 数据 ， 但 是 你 可 以 很 容易 地 修改 它 从 而 仅 返 回 那 些 数据 的 一 个 子 集 ， 减 少 从 网 络 来 的 有 效 载 伍 容量 的 大 
小 。 你 可 以 用 以 下 的 查询 选择 仅 仪 返回 Adam 的 名 字 和 在 IS_FRIEND_OF 关 系 两 端 朋 友 的 名 字 。 


MRTCH ( x:FPerson { userIid: { UIQ } } }-[r:IS FRIEND OF] - (Y) 
RETURN 
XxX.name as Name 


collect (ly.name) as frliend names 


10.3.4 ”使 用 远程 客户 端 库 帮 助 访问 Neo4j 服 务 器 


10.3.2 书 介绍 如 何 使 用 curl 客 尸 端 用 细 燃 度 低层 REST API 进 行 操作 ， 你 还 可 能 意识 到 ， 如 果 你 不 得 不 进行 解析 JSON 构 建 适 
当 的 URL 并 在 后 来 跟随 它们 时 ， 这 可 能 被 证 明 是 相当 繁琐 的 。 你 还 额外 学 到 了 如 何 使 用 Cypher 端 点 作为 访问 Cypher 服 务 器 的 另 
一 种 方法 。 然 而 ， 由 于 具有 细 粒 度 APl， 所 以 你 需要 完全 理解 执行 的 低层 人 查询， 包括 解析 和 构建 JSON 结 果 。 


你 可 以 选择 使 用 社区 贡献 的 Neo 浊 远程 客户 闯 库 乙 一 来 提供 一 个 开 上 友 者 更 友好 的 接口 ， 这 可 以 为 你 做 大 量 的 低层 工作 。 
10-5 展 示 了 这 样 的 设置 。 许 多 语言 和 框架 的 结合 也 是 有 的 个 远程 REST 封 疼 的 列表 (以 及 一 般 用 途 的 封 沪 ) 可 以 
在 http://www.neo4j.org/develop/drivers 找 到 。 在 本 书写 作 的 时 候 ， 这 个 列表 包括 Java、.NET、Python、Django、PHP、 
JRuby、Javascript 和 Cjlojure。 


这 些 库 和 框架 使 得 其 与 许多 方面 的 REST API 的 集成 成 为 一 个 更 令 人 喜悦 的 经 历 而 不 是 只 尝试 直接 使 用 本 机 的 APl。 程 序 10-8 
给 出 了 一 个 Java 客 户 靖 如 何 能 够 使 用 Java REST 绑 定 库 (java-rest-binding library) (https://github.com/neo4j/java-rest- 
binding) 通过 Adam 的 所 有 关系 开始 导航 。 这 一 特定 的 绑 定 便 在 著名 的 GraphDatabasesService API 后 面 绑 定 REST 调 用 非常 方 
便 ， 这 你 已 经 在 Neo4j 的 丛 入 了 式 模 式 中 遇见 过 。 


你 的 客户 端 应 用 程序 | JVM 
x | | Neo4j 服务 器 
广 7 并 bb " 
你 的 i 1 | 柑 入 式 网 页 
了 \ / Java / 服 A 二 
| | NET 人 Neo4j 服务 器 库 
你 的 代码 起 .|j"\、| Dijango/ 
本 nodejs RESTAPI 
i remote a 
| 性 的 代 人 的 / client | 
,| libraries Lads 
i 1 \ iIDraries Ned 
你 的 代码 \ 数据 库 
相 Wy 


图 10-5 ”使 用 远程 REST 客 户 端 库 的 基于 服务 器 的 部 署 方法 


【程序 10-8】 Java REST 客 户 端 使 用 Java REST 绑 定 库 


人 已 是 一 个 后 六 aDPHDatahbaseSerTIIECe 
和 实施 ， 它 将 所 有 的 方法 调用 转换 为 场 量 后 面 的 REST 调用 。 
GraphDatabaseService database 


= new RestGraphDatabase ("http://localhost:7474/db/data").; < 
Node adam = database.findNodesByLabelhndPropertyl! < 
PERSON, "userId", "adam001") 
iterator(} .next (},; 
Iterable<Relationship> adamRelationships = adam.getRelationships(); 
for (Relationship rel: adamRelationships) 1 
logger.infol"Navigating Adams Relationship; found type " + 
Tel, et Te Ramey 翻译 成 为 一 沾 让 http-//localhost:-:7474/db/data/ 


node/0/relationships/all 上 的 HTTP GET 调用 。 


翻译 成 为 一 小 在 http://localhost:7474/db/data/labell 


person/nodes?userId-=%22adam001%22 上 的 HTTP :GE 调用。 


四 注意 


neo4j-test-graphdb 绑 定 提 供 了 两 种 方式 与 服务 器 进行 交互 。 第 一 种 方式 是 RestAPIFacade 接 口 ， 它 提供 基本 Neo4j REST API 周 
围 的 单一 封装 。 另 一 种 方式 (程序 10-8 中 使 用 的 ) 是 使 用 一 个 GraphDatabaseSetvice 实 施 ， 它 代表 了 场景 背后 适当 的 REST API 调 
用 。 尽 管 第 二 种 方法 可 以 很 方便 地 使 用 你 已 经 熟悉 并 喜欢 的 GraphDatabaseService 接 口 ， 但 是 必须 强调 的 是 你 不 能 期 待 获得 与 谱 入 
式 模式 同样 的 性 能 。 涉 及 的 额外 网 络 调用 将 使 Neo4j 服 务 器 调用 比 简单 谱 入 式 模式 调用 具有 更 少 的 选择 。 当 使 用 
GraphDatabaseService 时 ， 你 需要 使 用 不 同 的 策略 ， 这 样 可 以 使 GraphDatabaseService 通 过 网 络 与 服务 器 对 话 以 获得 可 接受 的 性 能 。 
本 章 的 后 面 将 讨论 这 些 选项 。 


10.3.5 ”服务 器 插件 和 dE 托 官 扩展 


Neo4j 提 供 两 种 主要 机 制 避 免 基 本 REST API 的 见长 和 繁琐 的 性 质 (Cypher REST 吧 点 除外 ) : 服务 器 插件 和 非 托管 扩展 ， 
如 图 10-6 所 示 。 


人 


客户 端 应 用 程序 JVM 


六 区 Neod4 服 秀 器 
你 时 代 倍 ke | 棋 入 二 网 页 RE 
Java ! 服务 品 Neo4j 服务 诲 库 
NET 2 本 
你 的 代 人 后 Dijango | as a | 
ER 日 定 多 REST 请 J 人 
fn 本 remote HIIP | 
i E a 
lL 性 的 代 位 chent RES TAB SC 务 器 质 忻 7 
和 libraries Se | 
生生 人 人 Neod] 
加 本 2 下 


图 10-6 ”通过 服务 器 插件 和 非 托管 扩展 访问 Neo4 


这 两 个 选项 允许 你 写 服务 器 端 代码 来 补充 或 加 强 已 存在 的 REST API 提 供 工具 ， 并 且 它 们 有 时 与 关系 数据 库 的 已 经 保存 的 方 
法 进行 比较 。 他 们 试图 通过 提供 一 种 务 载 服务 器 端的 一 些 繁重 钦 辑 绕 开 一 些 服务 器 模式 前 后 属性 固有 的 性 能 限制 ， 只 将 最 后 结 
返回 到 客户 端 。 特 别 地 ， 非 托管 扩展 提供 了 一 个 定义 域 更 友好 的 REST API 的 机 会 。 你 将 会 在 10.5.3 和 10.5.4 节 中 看 到 如 何 写 服 务 


器 插件 和 非 托管 扩展 的 例子 ， 这 两 节 将 介绍 如 何 设置 服务 器 以 便 获 得 服务 器 的 最 好 性 能 。 在 那 乙 前 ， 我 们 将 对 诅 入 陈 模式 和 服务 
器 模式 进行 比较 。 


10.4 权衡 选项 


现在 你 已 经 对 藤 入 式 模 式 和 服务 器 模式 的 工作 及 它们 之 间 的 区 别 有 了 一 个 很 深入 的 了 解 ， 现 在 我 们 将 继续 探讨 每 一 种 模式 的 
优点 和 缺点 。 你 将 会 看 到 选择 一 种 模式 而 不 选择 另 一 种 模式 的 道理 ， 以 及 做 出 这 种 选择 的 可 能 影响 。 表 10-1 总 结 了 讨论 的 主要 


万 面 。 这 里 的 大 多 数 万 面 可 以 按 结构 和 性 能 的 考虑 被 广泛 的 分 类 ， 只 有 少数 会 分 为 另外 的 类 别 。 我 们 将 开始 从 这 些 观点 攻克 它们 
之 间 的 比较 。 


表 10-1 Neo4j 的 葡 入 式 模式 与 服务 器 模式 的 优点 和 缺点 


Tr 了 
隔 言 限制 【 仅 支 持 Java 和 JVM 语言 ) 
梧 能 的 公共 库 与 你 的 应 用 鸭 冲 完 
应 用 程序 流程 与 Neodi 的 紧 耦 人 台 
应 用 程序 可 能 潜在 的 影响 数据 库 的 性 能 或 数据 库 
彩 啊 应 用 程 太 的 性 能 
不 能 在 应 用 程序 中 独立 的 定制 Neo 


服务 类 到 区 点 
韭 艳 合 结 构 ;， 你 可 以 不 售 玉 于 应 用 程序 i ji 
乾 皖 和 麻烦 的 甸 炉 度 REST API 是 二 者 
定制 和 管理 Neojj 是 这 和 用 闫 的 细 
支持 太 量 的 客户 端 平台 (不 仅仅 是 基于 
服 备 货 恒 式 JYM 的 ) 
名 客 户 端 可 以 使 用 数据 库 


速度 


对 人 式 模 式 能 够 直接 充分 利用 低层 APIs 
能 够 探 作 HA 设 里 


较 慢 的 速度 ,虽然 使 用 REST 流 、Cypher 批 处 理 、 
服务 右 插 件 和 扩展 可 能 给 于 一 定 的 帮助 

在 现在 的 时 间 段 ， 疏 限于 对 本 机 的 REST API 由 
理 JSON 或 HTML 啊 应 


能 够 探 作 HA 设 星 


Neo4j 被 成 功 地 以 嵌入 式 模式 和 服务 器 模式 应 用 于 刚 开始 的 公司 和 大 公司 ， 例 如，Adobe、Ebay 和 GameSys， 因 此 ， 你 可 
以 放心 的 使 用 ， 这 两 种 方式 都 经 过 了 不 同 规模 的 公司 的 使 用 验证 。Neo Technology 公 司 是 Neo4j 的 商业 资助 人 ， 提 供 了 一 个 具 
有 各 种 不 同 设置 成 功 使 用 Neo4j 顾 客 清 单 (包括 他 们 当中 的 一 些 实例 学 习 ) 。 更 多 的 信息 请 参阅 Neo Technology 公 司 的 网 


站 : http://www.neotechnology.com/customers。 


10.4.1 ”对 架构 的 考虑 
当 你 开始 着 手 任何 一 个 项 目 时 ， 第 一 件 需要 考虑 的 事情 是 轧 体 的 染 构 需求 是 什么 ， 包 括 需 要 支持 哪些 类 型 的 客 尸 端 用 己 。 
现在 ,我 们 将 不 考虑 像 是 否 需 要 HA 的 问题 。 这 并 不 是 品 HA 不 重要 ,但 是 为 了 本 市 的 目的 ， 它 不 是 等 式 的 一 部 分 ，HA 将 在 
第 11 草 中 讨论 。 这 足以 说 明 同 入 式 模式 和 服务 器 模式 确实 适合 HA。 
1. 语 言 考虑 


当 涉 及 项 目 时 ， 如 果 你 有 任何 特定 的 语言 限制 ， 这 目 然 是 构成 你 做 决策 的 主要 因素 之 一 。 服 务 器 模式 相对 于 家 入 式 模 式 .能够 
适合 大 多 数 的 客户 端 平台 。 许 入 式 模 式 仅 限于 使 用 Java 或 其 他 基于 JVM 的 语言 之 一 ; 而 服务 器 模式 能 够 处 理 任何 的 能 与 HTTP 对 


话 的 客户 站 。 
2. 关 注 点 的 分 离 : 对 应 用 (APP) 关注 VS 对 数据 库 (DB) 关注 
先 不 考虑 客户 端的 选择 ， 需 要 考虑 的 更 基本 事项 之 一 是 你 需要 什么 样 的 规模 和 与 Neo4 数 据 库 分 离 的 管理 你 的 应 用 程序 。 


为 了 使 这 个 讨论 更 具体 ， 考 虑 图 10-7 中 显示 的 前 面 章节 提 到 的 两 种 可 以 选择 规划 基于 电影 的 社交 了 网络 应 用 的 模式 : 诅 入 陈 
模式 和 服务 器 模式 。 让 我 们 假设 对 一 个 网 页 应 用 有 一 个 需求 使 普通 的 用 户 能 够 互相 交互 ， 以 及 一 个 管理 部 分 或 分 离 的 应 用 ， 在 那 
里 被 授权 的 管理 员 可 以 执行 维护 和 日 常事 务 ， 例 如 加 载 新 电影 、 删 除 老 用 户 等 。 


在 铅 入 式 模 式 中 ， 生 命 周 期 、 内 存 和 应 用 程序 的 处 理 能 力 (social-movie.war) 紧 紧 地 与 突入 式 Neo4j 数 据 库 捆绑 在 一 起 ; 
而 对 于 服务 器 模式 ， 具 有 分 离 的 JVM 管 理应 用 程序 和 Neo4j 数 据 库 (JVM1 和 JVM2) 。 在 服务 器 版 本 中 ， 管 理应 用 程序 以 自己 
基于 PHP 的 网 页 客户 端 分 离 出 来 ， 甚 至 主 程序 部 分 和 应 用 程序 互相 脱离 。 


导入 去 概 式 
Java 知己 哺 一 一 
CC 


Apache 


We I a ER 
| 导 出 展 于 前 条 


Tomecat (JVM 1 


soclal-movye.w ar 


联 入 式 
网 页 


soclal -movie.war 


上 .HITP | 
i 1 J A ~ | 
| 网 页 浏览 器 pp | 一 一 一 | 
| | | ， I 八 的 六 Nao 阴 AT Neod] | 
ne 和 模式 ( 非 HA 让 [天 据 在 檀 

. 一 

| | 

Java chent — eater re 
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| 和 i 和 有 上 a bil | 
PHP 客户 端 | ，,/app 入 服务 器 

/admln-app Your Ta | 
了 classes 9 “ea = 

EF | BHR " ut 程 API Neo4] 
| Ye Drowser | [等 理应 用 ) AL 人 4 ne 
Po——— 入 | RESTAPI store || 
| 

es ~ pT 

Rs PHP| HIIP | 
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图 10-7 社交 网 络 应 用 程序 的 两 种 可 能 规划 情况 : 内 入 式 和 服务 器 模式 


在 认 入 陈 模式 中 ， 你 的 应 用 程序 与 Neo4j 共 享 同 一 个 JVM ， 因 此 也 共享 相同 的 Java 堆 ; 它们 经 受 同 样 的 垃圾 收集 (GC) 周 
期 并 且 将 从 本 质 上 一 起 生存 和 一 起 消失 。 如 果 你 的 应 用 程序 引起 或 触 友 从 入 陈 蛋 式 的 GC， 将 会 影响 到 Neo4j 的 性 能 。 当 Neo4j 
反应 慢 的 时 候 ， 可 能 仅 仪 是 一 个 暂停 在 等 待 一 个 GC 的 完成 。 当 你 想 从 你 的 应 用 程序 分 离 调试 Neo4 JVM 和 GCC 参数 时 也 会 有 这 
种 情况 友 生 ， 这 是 因为 它们 具有 本 质 上 不 同 的 使 用 方式 。 不 斑 的 是 ， 在 舱 入 式 模 式 中 ， 这 是 不 可 能 的 。 你 需要 寻找 对 数据 库 和 应 
用 程序 结合 需求 的 合理 功能 设置 。 束 像 前 面 已 经 说 过 的 ,许多 公司 具有 成 功 的 Neo 笑 嵌入 式 模 式 应 用 程序 ， 但 是 很 明显 这 一 领域 
需要 一 些 特殊 的 考虑 。 第 11 章 将 更 深入 详细 地 讨论 如 何 调试 和 维护 JVM 以 便 以 最 佳 的 状态 使 用 Neo4j。 


另外 ， 因 为 Neo4j 是 一 个 基于 Java 的 应 用 程序 ， 它 将 依赖 于 其 他 的 一 些 公 共 库 。Neo4j 使 用 Lucene 作 为 它 的 核心 索引 实现 
( 见 程序 10-2) 。 尽 管 已 经 天 注 到 了 最 小 化 这 些 依赖 ， 如 果 你 的 应 用 程序 也 在 使 用 任何 的 这 些 共享 公共 库 ， 你 将 需要 确保 在 
JVM 中 任何 的 时 间 只 包含 和 使 用 一 个 合适 的 版 本 ， 否 则 或 者 在 你 的 应 用 程序 中 或 者 在 数据 库 的 行为 上 将 会 导致 不 可 预期 的 结 
果 ， 这 一 般 不 会 是 个 大 的 问题 ， 但 是 必须 注意 到 这 个 问题 。 


3. 对 硬件 的 考虑 


与 前 面 天 注 的 分 离 问题 紧密 相关 的 是 对 硬件 的 考虑 。 为 了 使 Neo4j 的 操作 和 功能 尽 可 能 保持 有 有效， 理想 的 情况 是 需要 一 人 台 强 
壮 的 电脑 ， 具 有 许多 内 存 和 足够 快 的 磁盘 〈 详 见 第 11 章 ) 。 如 果 你 的 设置 不 可 能 实现 ， 例 如 ， 如 果 你 有 一 个 已 经 存在 的 有 限 的 
应 用 程序 服务 器 或 者 一 组 因 各 种 原因 不 能 升级 的 组 件 ， 那 么 在 你 的 应 用 程序 中 使 用 启 入 式 .模式 的 Neo4 将 肯定 使 你 的 硬件 瘫痪 。 


在 这 种 情况 下 ， 一 种 可 能 是 损 一 台 具 有 足够 内 存 的 新 设备 ， 使 Neo4j 服 务 器 实例 能 够 安 半 在 上 面 ， 把 应 用 程序 服务 器 留 给 
符合 的 内 存 配置 的 其 他 程序 用 。 如 果 你 能 够 升级 你 的 设备 以 适应 Neo4j 的 额外 需求 ， 使 用 能 入 陈 的 方式 是 一 个 可 行 的 选择 。 


10.4.2 ”对 性 能 的 考虑 


性 能 是 验 入 了 式 模 式 和 服务 器 模式 不 同 的 天 键 问 题 。 当 通过 本 机 的 Java API 相 对 于 REST API 做 一 组 相同 的 操作 直接 比较 运行 
的 时 间 时 ， 裔 入 陈 模 式 的 Neo4j 总 会 胜 过 服务 器 模式 的 Neo4j。 这 是 由 于 增加 的 延迟 和 相关 的 通过 网 络 的 调用 。 


通过 原始 比较 的 方式 ， 结 果 如 表 10-2 所 示 ， 显 示 的 是 以 毫秒 表示 的 藤 入 式 和 服务 器 模式 创建 一 百 万 个 具有 name 属 性 的 新 用 
尸 书 点 所 用 的 时 | 间 ( 圆 括号 里 面 的 是 每 秒 的 三 点数) 。 每 一 个 新 用 户 节 点 都 是 在 目 己 的 事务 (TX) 中 ( 髓 入 式 模 式 使 用 本 机 的 
Java API， 服 务 器 模式 使 用 REST AP1) 创建 的 。 


表 10-2 ” 当 创 建新 节点 时 典 入 式 模式 相对 于 服务 器 模式 的 性 能 原始 结果 


人 | 嵌入 式 模式 服务 器 模式 


每 节点 1 个 事务 (1000000x1) | 168 815 毫秒 (5952 节点 / 秒 ) | 2 380 140 毫秒 (420 节点/ 种) 


注 : 运行 于 苹果 笔记 本 电脑 上 ， 有 具有 16GB 的 内 存 、1TB 的 固态 硬盘 (SSD) 的 MacBook Pro (加密 系 统 FileVault 打 开 ) 。 
Neo4j 服 务 器 运行 于 同样 的 本 地 电脑 上 且 同 时 运行 单元 测试 ， 单 元 测试 使 用 的 neo4j-rest- 图 形 数 据 库 REST 客 户 端 库 前 面 已 详细 讲 


从 表面 上 看 ,这些 数字 并 不 很 好 看 ， 即 使 嵌入 式 模 式 也 是 。 三 分 钟 创建 一 百 万 个 节点 ? 不 要 感到 绝望 ， 这 个 例子 是 为 了 证 明 
一 个 点 。 这 个 问题 不 只 是 一 个 讨论 哪 一 种 模式 更 快 的 简单 的 案例 。 相 反 ， 给 定 一 种 情况 ， 做 什么 才能 获得 最 佳 的 性 能 ， 并 且 是 可 
接受 的 性 能 才 是 我 们 要 考虑 的 重点 。 一 些 执行 操作 的 调节 方式 能 对 性 能 造成 重大 的 影响 。 


表 10-3 显 示 当 你 充分 利用 事务 (岁入 环 模 了 式 的 本 机 事务 和 服务 器 模式 的 批 处 理 ) 时 ， 性 能 变 得 好 很 多 。 这 一 简单 的 变化 对 
切 始 的 数字 具有 很 大 影响 : 众 入 陈 模 式 快 了 高 达 10 倍 ， 服 务 器 模式 使 用 批 处理 快 了 16 倍 。 


表 10-3 ” 当 创 建新 节点 时 座 入 式 模式 相对 于 服务 器 模式 的 扩展 结果 


场景 服务 器 模式 

每 节点 1 个 事务 (1000000x1) 168 815 毫秒 ( 5952 节点 / 秒 ) | 2 380 140 毫秒 (420 节点/ 种) 
所 有 节点 1 个 事务 (1x1000000) | 25 654 密 种 (40000 节点 /7 秒 )| 时 间 太 长 ， 挂 机 了 

批 处 理事 务 (20x500000 ) 16 081 蔓 秒 (62 500 有 点/ 秒 ) 川 148 357 坚 秒 16756 节点 /种 ) 


Lu | Fa | = 


每 当 你 看 到 性 能 的 数据 时 ， 确 保 理解 如 何 将 性 能 比较 的 测试 放 到 一 起 以 及 什么 因素 起 作用 或 不 起 作用 。 为 了 直接 说 明 这 些 情 
况 ， 程 序 10-9 和 程序 10-10 给 出 了 执行 这 些 比较 所 使 用 的 代码 。 


【程序 10-9】 。 欣 入 环 模 式 性 能 测试 比较 所 用 代码 


吕 Before 
B13 写 此 下 上 二 局 及 站 二 可。 吾 息 已 ， thro IOEXCepnt! i wo 

pu 二 号 a ie void setup(l} LOWS cep A { 租 建 测 读本 用 的 新 柑 入 

graphDbBuilder = new GraphDatabaseFactory'!) 的 

.newEmbeddedDatabaseBuilder ("target /mytestodb'),. 式 数 据 库 

draphDe = graphDbeBuilder.newdraphDatabasel): 

1 

加 TT 全 EB 

publie void timeCcreateNodesEmbeddedModeInseparateTxs {(} | 嵌 凡 式 测 斌 表 10-3 中 
timecCreateNodes ("EmbeddedModeInSeparateTxs",; 1000000,1); 第 工 和 的 对 应 扰 果 

} 

量 工 筷 瑟 七 

public void timCreateNodesEmbeddedModeInoneTx{) | 坝 六 式 油 斌 表 10-3 中 
timeCcreateNodes ("EnmbeddedModeInoneTx",1,1000000).， 萄 二 行 的 对 应 站 时 

】 

六 TIT 全 St 

public void timecreateNodesEmbeddedModeInMultiBatchedTx() 1 嵌入 起 得 试 表 10-3 中 

timeCreateNodes ("EmnbeddedModeInMultiBatchedTx" 20,50000}:; 第 3 行 的 对 应 站 时 
| 


private void timeCreateNodesl! 
String Scenario, int numTxs, int numNodes2CreatePerTx) | 
StopWatch stopWatch = new StopWatch (scenariol): 
dtopWateh.start |}: 
for {fint a = 0; a < NUmMTXS; At++) 1 
try (Transaction tx sa draphDe.beginTx(y) | 
for (int 1 = 0; i < numNModes2CreatePerTx; i++4+) 1 


Node nede = graphDE. createNode'): 合用 本 机 的 图 这 API 
node .setProperty("name'", "UsSer ™ + 1); 例 建 新 节点 


| 


七 入 . 可 UE ()】 ， 


= 


| 


stopWatch.,stopt(); 


is 


【程序 10-10】 ”服务 器 模式 性 能 测试 (原始 AP1) 比较 所 用 代码 


恬 且 局 二 总 芋 已 忆 上 品名 名 
publics static void setupl) throws IOException | 
restAPI = new ResthPIFacadet"'http://localhost:7474/9b/data):; 


项 工 已 于 七 


连 革 局 域 Weodj 
服 备 器 运行 测试 


上 | 5 -3 节 上 
Public void timeServerModeRawRestAPIInSeparatebBatchesstreamingoOff(t) ( | 蛋 备 器 模式 测试 
timeCreateNcodes ("ServerModerawResthPIINSeparateBatcechesstreaminagoffr". 表 10-3 中 冀 工 和 
false, false, 1000000, 11): 的 对 点 扫 暴 
| 
而 业已 可 七 
ee Fe 3 
public void timeSserverModeRawRestAPICOneBatchstreamingOff () 1 服务 器 模式 测试 未 
timecCreateNodes("time ServerModeRawRestAPIOneBatchstreamingoffr". 中 二 引 时 全 行 的 草 
talse, truie, 1, 1000000); 泪 果 
| 应 兰 oi 
I 
而 工程 号 七 
Epublic void timesServerModeRawRestAPIINnMultiBatchesstreamingofe 服务器 虱 式 测试 烛 
timecCcreat ER EE 二 nMultiBatchesstreamlingotrt", i0=3 申 第 了 3 行 的 


void timeCreateNodegd (Strindg Sgtenario,. 
batchMode,. 
numNodes2CreatePerBatceh}) 1 


private 
Docnlean 
Ti 


boolean Stream: 
1nt rumBEatecelhes, 


syatem., SetProperty ConLlg. CONFIG STREANM, 
Eoolean.tostring(lstream}) ) ; 
Systenm. set Property (Config. CONFIG BATCH 


1 


Boolean .tostringlbatechMode)}.:; 


! TRANSE 


StopWateh stopHateh = new StonpWatch'sacenarin) 


BtopWatch, start(); 


用 REST 排外 for {int a 0; a < numBatches; at++}) | 
A b> try (Transaction tx = restAPI. begqinTrx()} | 
于 于 可 瑟 工 = 马 , i i | 
= < NumNodldes2CreatePerBatch:; 
rr Tr [ 潮 
FRE] 事务 Map<str1ing, ob Ct Dons ew 
.2 | Props.,PUut ("name”, "USger ® d i 
Node node = restAPIl ,createNode (propsi: 
1 
1 
二 
】 
上 
1 
上 
satopWatch.stopt}:; 


当 一 个 REST 事 物 开始 后 (@) 
Transaction 的 try 模 块 完成 ) 。 这 时 ， 整 个 请 求 集 通 
启用 的 。 要 打开 它 ， 你 需要 设置 系统 的 属性 org.neo4j.rest.batch transaction=true, 


其 是 REST APl， 


作为 
不 意味 着 它 应 该 被 简单 地 排除 在 外 。 有 相当 多 
10.5 节 将 专门 讨论 这 个 问题 。 


10.4.3 ”其 他 需要 考虑 的 事项 


除了 已 经 考虑 过 的 结构 和 性 能 问题 ， 还 有 几 个 额外 的 问题 需要 考虑 ， 这 也 会 影响 


模式 ) 。 


1.REST API: 支持 的 数据 交换 格式 


(LET. 


的 可 选 方式 和 方法 可 以 改进 Neo4j 在 服务 器 模式 的 性 能 使 其 达 


1+t) | 


shMap<sString, Ob]ect»l): 


泣 计 REST 及 PI 恤 出 
请 求 创 建新 节点 


这 是 通过 


人 @ 完 成 的 。 


到 选择 哪 一 种 模式 ( 褒 入 式 模式 还 


词 rile Fr 重 可 区 目 十 识 


， 所 有 后 续 的 REST 调 用 仪 仅 是 收集 起 来 并 存在 内 存 中 直到 这 个 事务 标记 为 完成 (直到 具有 
络 作为 日 一 的 批 处 理 请 求 友 送 。 应 该 注意 的 是 这 个 批 处 理 行为 默认 是 没 


在 性 能 方面 会 降低 很 多 ， 这 是 由 于 基于 网 络 的 调用 需求 ， 但 这 并 
到 可 接受 的 水 平 。 


不 是 服务 器 


REST API 当 前 仅 文 持 jJSON 和 HTML 作 为 数据 交换 格式 。 如 果 你 喜欢 用 XML 或 其 他 一 些 格 式 ， 那 你 的 运气 残 灰 佳 了 。 使 用 不 


同 的 数据 交换 格式 的 唯一 方式 是 使 用 非 托管 扩展 (参见 10.5.4 节 ) ， 
互 。 当 你 沿 着 这 条 路 走 下 去 时 ， 


这 需要 定义 你 自己 的 REST 接 口 访问 数据 库 和 与 数据 库 交 
你 的 确 失掉 了 使 用 所 有 预先 构建 的 REST API 功 能 的 能 


2. 事 务 


Neo4j 是 一 个 完全 兼容 ACID 的 数据 库 。 当 使 用 散 入 陈 模 式 时 ， 这 是 一 个 相当 简单 的 合 题 ， 但 是 对 于 服务 器 模式 ， 有 时 会 产 
生 几 个 有 趣 的 具有 挑战 性 的 问题 。 


在 服务 器 模式 中 ， 黑 认 情况 下 ， 每 一 个 HTTP 请 求 被 当 作 单个 事物 。 这 意味 着 ， 例 如 ， 如 果 你 的 所 有 处 置 都 是 使 用 本 机 REST 
API1， 你 将 不 能 创建 两 个 节点 作为 单个 事物 的 部 分 行为 (本 机 REST API 需 要 两 个 分 离 的 HTTP POST 请 求 ， 这 将 作为 两 个 分 离 的 
事务 ) 。 


在 服务 器 模式 中 处 理事 务 场景 的 方法 包括 以 下 几 种 : 
` 使 用 Cypher 端 点 。 
` 使 用 REST 事 物 端点 。 
` 使 用 服务 器 插件 或 非 托管 扩展 。 
` 使 用 批 处 理 操作 。 


根据 具体 情况 ， 你 可 以 定义 一 个 单一 的 Cypher 声 明 ， 它 能 够 在 一 个 事务 调用 中 执行 多 个 操作 。10.5.2 节 提供 了 更 详细 的 使 
用 Cypher 并 点 的 情况 。 另 外 ， 也 有 一 个 事务 REST 吧 点 (http://docs.neo4j.org/chunked/stable/rest-api- 
transactional.html) ， 人 允许 你 在 事务 的 范围 内 ， 通 过 多 个 HTTP 请 求 执行 一 系列 Cypher 声 明 。 具 有 了 这 个 选项 ， 客 户 端 显 式 地 
通过 专用 的 REST 新 点 发 出 提交 或 回 浴 的 指令 。 


服务 器 插件 和 非 托 管 扩展 使 你 可 以 编写 服务 器 并 代码 获取 数据 在 单个 HTTP 请 求 中 创建 节点 ， 然 后 在 服务 器 并 确 保 在 单个 事 
物 中 创建 这 些 节点 (参阅 10.5.3 节 和 10.5.4 节 的 例子 ) 。Neo4j 也 提供 称 为 批 处理 操 作 (batch operation) 的 功能 ， 人 允许 你 通过 
单个 HTTP 调 用 友 送 成 组 或 成 批 的 低级 指令 ， 当 在 服务 器 端 执行 时 ， 所 有 的 批 处 理 指令 被 当 作 一 个 单个 单位 执行 。 更 多 关于 批 处 
理 操作 的 信息 可 以 阅读 Neo4j 手 册 的 “事物 的 HTTP 端 点 ”一 节 (http://neo4j.com/docs/stable/restapi- 


transactional.html) 。 


10.5 ”元 分 利用 服务 器 模式 
最 后 一 节 强 调 在 给 定 的 一 组 环境 情况 下 ， 从 服务 器 模式 中 获取 最 好 性 能 的 选项 。 束 像 我 们 前 面 讲 过 的 ， 服 务 器 模式 会 比 藤 入 
式 模式 在 性 能 方面 经 受 更 多 的 影响 ， 但 是 ， 通 过 使 用 这 些 技术 和 方法 ， 服 务 器 模式 的 性 能 可 以 达到 可 接受 的 水 平 。 


要 完全 理解 和 领会 我 们 将 给 出 的 这 些 方 法 之 间 的 区 别 ， 本 节 的 剩余 部 分 将 使 用 社交 网 络 领域 作为 一 个 例子 来 看 看 这 些 不 同方 
法 如 何 导致 不 同 的 性 能 指标 。 假 设 你 有 一 个 需求 要 得 找 和 返回 一 个 用 户 的 直接 朋友 的 所 有 名 字 ， 尤 其 是 那些 名 字 以 字母 J 开 头 的 
朋友 。 在 你 的 系统 中 ， 早 已 经 存在 一 个 用 户 设置 ，Adam 拥 有 600 个 直接 朋友 ， 其 中 15 个 名 字 以 字母 J 开始 (Adam 的 userld 是 
adam001; 这 个 用 户 已 经 被 专门 索引 过 ， 他 的 节点 编号 磁 15 是 0) 。 


在 试验 中 使 用 两 个 不 同 的 客 尸 端 : 第 一 个 是 UNIX curl 客 尸 端 ， 另 一 个 是 java-rest 绑 定 客 尸 端 (你 能 够 找到 前 面 我 们 用 来 做 
源 代码 的 一 部 分 curl 脚 本 和 JUnix 客 户 闯 测试 类 ， 附 录 B 提 供 了 运行 这 些 代 码 的 指导 ) 。 


表 10-4 提 供 了 一 个 模板 ， 当 你 按照 步骤 去 做 时 可 以 填 上 你 得 到 的 结果 。 


表 10-4 性 能 指标 日 志 : 模板 


wi as 的 调 忆 


原始 RESTAPI 
Cypher 再 用 
服 秀 丫 捅 件 
韭 托 省 扩展 


注 : 1. 时 间 以 毫秒 为 单位 。 


Es a i 


2.cutl 客 户 端的 时 间 是 使 用 bash time 命 令 完 成 的 。 

3.JavaREST 绑 定 的 时 间 是 使 用 Java (Spring) StopWatch 完 成 的 。 

4. 冷 调用 = 服务 器 首先 停止 然后 启动 后 在 第 一 个 REST 调 用 之 前 的 调用 。 
5. 热 调用 = 第 一 个 调用 后 没有 做 服务 器 重新 启动 的 第 二 个 调用 。 


冷 调用 与 热 调用 的 时 间 
对 服务 器 的 第 一 个 调用 ( 冷 调用 ) 包括 了 执行 第 一 次 引导 、 缓 存 、 初 始 化 过 程 需求 的 时 间 ， 这 在 随后 ( 热 调用 ) 的 调用 中 可 
能 不 存在 。 这 意味 着 冷 调用 总 会 比较 慢 ， 并 且 也 可 能 有 一 点 比 热 调用 更 具有 不 可 预测 性 。 我 们 将 为 你 提供 这 两 种 调用 时 间 的 完整 
图 示 。 


10.5.1 避免 细 粒 度 操 作 


作为 一 个 一 般 的 规则 ， 当 通过 网 络 执 行 任何 类 的 操作 时 ， 应 该 尽量 减少 执行 那个 操作 需要 的 网 络 跳跃 数 ， 并 且 这 一 相同 的 原 
理 也 适用 于 使 用 REST API 万 式 。 本 机 的 、 低 层 REST API 操 作 是 非常 细 粒 度 的 ， 一 般 是 在 任意 时 间 对 单一 节点 或 关系 的 操作 。 如 
果 使 用 不 当 ， 它 们 能 产生 大 量 的 不 必要 的 网 络 流量 。 


除了 只 使 用 具有 可 发 现 能 力 的 低层 REST APl 来 获取 数据 ， 你 应 该 考虑 下 面 可 能 导致 非常 少 的 网 络 调用 和 更 好 性 能 的 选项 。 
使 用 Cypher REST 端 点 。 
` 使 用 遍历 REST 端 点 。 
: 创建 一 个 服务 器 插件 或 非 托管 扩展 返回 结果 。 
为 了 创建 数据 ， 考 虑 这 些 选 项 : 
: 使 用 Cypher API 中 的 变更 功能 。 
. 使 用 REST 批 处 理 API。 
创建 一 个 服务 器 插件 或 非 托管 扩展 执行 任务 。 


如 果 你 是 在 使 用 具有 超 媒体 驱动 万 法 的 本 机 REST API 获 取 在 例题 场景 中 需要 的 数据 ， 你 将 需要 一 个 总 数 为 602 个 的 网 络 调用 
以 实现 这 个 目标 。 假 设 Neo4D 服 务 器 在 局 域 网 上 运行 在 端口 7474， 你 需要 做 以 下 的 事情 : 


* 在 http://localhost: 7474/db/data/node/0 上 做 1 次 GET 获 取 Adam 的 可 用 选项 和 数据 的 初始 信息 。 


在 http://localhost: 7474/db/data/node/ {nld} /relationships/all/IS_FRIEND_OF 上 做 1 次 GET 获 取 Adam 所 有 进 和 出 的 


IS_FRIEND_OF 关 系列 表 (参见 程序 10-6 的 请 求 /响应 (request/response) 的 详细 情况 ) 。 


` 在 http://localhost: 7474/db/data/node/ {nld}/propetties 上 做 600 次 GET 获 取 第 一 次 调用 返回 的 每 一 个 关系 结构 (将 有 600 个 
条 目 ) 。 然 后 你 将 使 用 最 终 的 URI 构 建 下 一 个 调用 ， 这 将 返回 结束 节点 (朋友 ) 的 所 有 属性 。 在 每 一 次 的 调用 中 返回 的 JSON 可 
以 被 解析 和 用 于 仅仅 返回 那些 以 J] 开头 的 姓名 。 


更 新 了 的 性 能 指标 如 表 10-5 所 示 。 


表 10-5 场景 1 本 机 REST API 后 的 性 能 指标 日 志 


| curl i Java REST 比 定 
冷 调用 “| 热 调用 
02 


原始 REST API 5726 至 秒 | 5303 本 1066 毫秒 | 917 毫秒 
Cypher 调用 
服 备 兹 插件 


ss 


韭 托 管 扩展 


10.5.2 使 用 Cypher 


Neo4j REST API 为 你 提供 了 通过 对 指定 的 负责 响应 查询 的 REST 端 点 发 布 适当 的 查询 或 声明 和 参数 对 服务 器 运行 任意 
Cypher 声 明 。 假 设 你 具有 了 所 有 的 需要 创建 查询 或 声明 的 所 有 信息 ， 这 将 只 需要 一 次 网 络 调用 。 


使 用 从 请 求 服务 根 URL 返 回 的 咽 应， 在 10.3.2 节 中 有 详细 的 摘 述 ， 相 对 于 Cypher 键 定义 的 URL ( 见 程序 10-4) 提供 进入 点 用 
于 发 送 Cypher 查 询 和 声明 到 服务 器 。 下 面 的 程序 片段 给 出 了 程序 10-4 的 服务 根 响应 。 


ibatch" : "http://localhost:7474/db/data/batch", 
cypher®™ ; "http://l]ocalhost:7474/db/data/cypher", 


程序 10-11 和 程序 10-12 给 出 了 满足 我 们 例子 场景 的 执行 一 个 Cypher 查 询 相应 的 请 求 和 响应 。 
【程序 10-11】 Cypher REST 请 求 


Hl1IP Regquest 


POST http://localhost:7474/db/data/cypher 执行 Crpher 声明 的 
Accept: application/json i 
Eo ， ， RBEST 师 品 
Content-type: application,]json 
| ouerv" 
"MATCH ( x:Person | userld: { lookupId 上 上 ) "query" 忆 全 一 个 标准 的 
-lr:IS FRI END EF en, cpher 查询 
WHERE friend.name =~ lname2fingd 
RETURN friend.name ", 
nparams" : | 
"lookupId" : "adam001", 局 在 查询 中 使 用 的 “params 
mame2find®™ : 可 .二 


实际 的 Cypher 查 询 是 在 JSON 请 求 的 query 的 键 中 指定 的 (人 @) ， 并 以 params 键 (@) 作为 键 - 值 对 提供 任意 相关 的 参数 。 
【程序 10-12】 Cypher REST 响 应 


HTTP Respongse 
200; OK 


排序 的 数组 字段 名 字 表 示 在 数据 
Content-Type: application,/]son 


中 要 返回 的 数据 


neolummes" : | "friend.name"™ |], 


"NonJFriend 3" ; "JFriend 4”" 


es 性 昌 


排序 的 握 回 数据 数组 与 那些 字段 
。 Tr 四 LT | i BA 一 #h = i 


| 标识 的 灯 宝 
人 怀 3 国 要 组 


ndata™ : [ [ "NonJFriend: II » "NonJFriend 2nm . 1 
| 


结果 以 定义 了 字段 标题 (人 @@) 和 对 应 的 数据 值 (人 @) 的 结构 返回 。 可 以 看 到 字段 名 字 匹 配 了 在 程序 10-11 的 请 求 中 指定 的 
RETURN 声 明 ， 并 且 所 有 匹配 了 这 个 字段 标题 的 名 字 作 为 程序 10-12 中 数据 段 的 一 个 名 字数 组 提供 。 更 新 了 的 指标 日 志 如 表 10-6 
所 示 。 


表 10-6 场景 2 Cyphet 调 用 后 的 性 能 指标 日 志 
Java REST 绪 定 


场 重 描述 司 服 务 帮 调用 的 数量 
I 执 调 冷 调 用 热 调 用 


原始 REST API 2 1066 译 秒 | 917 毫 种 
Cypher 调用 104 一 秒 32 晶 秘 


服务 毅 搬 件 
非 托 省 打 展 


ss i i 


这 一 方法 已 被 证 实 对 查询 的 性 能 具有 非常 大 的 改进 。 
10.5.3 ”服务 器 插件 


服务 器 插件 提供 了 一 个 第 载 一 些 处 理 密集 型 多 辑 到 服务 器 的 机 制 ， 而 不 是 把 所 有 的 都 放 在 客 尸 疡 运行 ， 那 样 束 会 在 完成 同样 
的 事情 时 多 次 请 求 ， 使 得 数据 来 回流 动 。 服 务 器 插件 有 一 些 像 天 系数 据 库 中 存储 的 程序 过 程 。 


服务 器 插件 专门 设计 用 于 扩展 已 有 的 REST APl 返 回 的 书 点 、 关 系 或 全 局 图 形 数据 库 的 选项 。 回 忆 一 下 当 我 们 一 个 特定 节操 
的 详细 情况 时 ， 你 获取 了 返回 的 很 多 选项 ， 包 括 一 个 extensions 键 。 参 见 下 面 的 程序 片段 作为 一 个 概括 。 


| 


"extensions" ; { . . .}, 


"property" : "http://localhost:7474/9db/data/node/0/properties/{key}", 
gelf" : "http://localhost:7474/db/data/node/0", 
"data™" : { "name" : "Adam" |] 

| 


这 代表 了 节操 的 扩展 点 列表 (可 用 的 服务 器 插件 ) ， 关 系 和 作为 一 个 整体 的 图 形 数据 库 也 会 有 相似 的 扩展 点 。 
要 写 一 个 服务 器 插件 ， 你 需要 首先 决定 目标 是 什么 或 要 扩展 什么 (节操 、 关 系 或 图 形 数据 库 选 项 ) ， 然 后 按照 下 面 的 步骤: 


1) 写 一 个 扩展 ServerPlugin 类 的 类 。 


2) 确保 服务 器 插件 类 的 名 字 完 全 合格 并 在 文件 org.neo4j.server.plugins.ServerPlugin 列 表 中 。 

3) 确保 插件 类 和 文件 是 JAR 文 件 ， 并 且 放 人 在 Neo4j 服 务 器 的 类 路 径 中 。 

4) 通过 友 现 然后 调用 适当 的 REST URL 访 问 这 些 消 数 。 

下 面 的 程序 给 出 了 我 们 创建 的 用 于 扩展 功能 的 一 个 ServerPlugin 类 ， 用 于 查找 名 字 以 J 开头 的 所 有 朋友 的 节点 。 


【程序 10-13】 ”服务 器 插件 类 


发 现 点 类 型 Public class JFriendNamesServerPlugin extends ServerPlugin 4 需要 抬 取 的 必须 护 
展 的 顾 务 器 插件 
> @PluginTlTarget (Node .class) 
人 Mame( "get friendnames starting with jj" ) 


EDescription!( "Returns names of all friends start with the letter J" ) 
Public List<String> getFriendNamesStartingWiths 


Wh ; ESOouUrce Node node ) 
将 和 芷 及 下 和 工 


API 中 骑 壬 GraphDatabaseService database = node.getoraphDatabasel); 
的 在 客户 站 try (Transaction tx = database.,beginTx(})) | 
使 用 的 省 字 | return JFriendGraphHelper .extractJFriendNamesFromRawAPl (node):; 
NO 定 的 发现 上 类 的 相应 引用 这 和 在 
public class JFriendGraphHelper 1 面 的 方法 中 用 于 执行 需求 的 无 论 是 是 画 数 


private RelationshipType 1S FRIEND OF = 
DynamicRelationshipType.withName ("IS FRIEND OF"™.; 


Public estatic st<String> extractJFriendNamesFromRawAPl (Node node) { 
i namegs = New ArravyList<Strings>():; 
for (Relationship rel: node.getRelationships (IS FRIEND OF)) | 
Node friendNode = rel .getoOtherNode (node).: 
String friendName = 
(String) friendNode .getProperty{("name", "unknown"™).; 
if (friendName .startsWith("™J")) | 
names.addlfriendName).; 使 用 苇 心 本 机 上 PIT 执行 实际 
} 池 避 的 辅助 方法 


etuUrn names: 


所 有 节点 都 是 平等 的 


当 一 个 插件 的 目标 是 一 个 节点 时 ， 它 的 目标 也 是 所 有 的 节点 。 即 使 还 辑 上 你 在 数据 库 中 定义 了 不 同类 型 的 节点 ， 例 如 usef 节 
点 和 movie 节 点 ，Neo4j 将 使 这 个 服务 器 插件 对 所 有 的 节点 都 可 用 。 应 该 谨慎 定义 能 够 用 于 所 有 节点 的 服务 器 插件 ， 或 者 有 一 些 机 
制 确 保 服 务 器 插件 只 在 适当 类 型 的 节点 上 执行 。 


扩展 ServerPlugin 类 (人 @) 将 会 确保 这 个 类 在 服务 器 启动 时 作为 选项 获取 。 对 每 一 个 需求 的 扩展 点 ， 应 该 创建 一 
个 指定 〈 通 过 @PluginTarget 注 释 (@) ) 发 现 点 是 什么 类 型 的 方法 。 这 将 是 节点 、 关 系 或 GraphDatabaseService 之 一 。 与 
@Name 注 释 (全 ) 相 结 合 ， 这 将 决定 在 哪里 和 在 什么 名 字 下 ， 额 外 的 REST 端 点 将 会 在 全 部 的 REST APl 中 出 现 。 也 会 需要 一 个 
对 方法 本 身 (人 @) 中 的 节点 、 关 系 或 GraphDatabaseService 的 参数 引用 ， 因 此 这 个 引用 能 够 被 用 于 执行 任意 的 可 能 需求 的 功能 
或 逻辑 。 


下 面 的 程序 给 出 了 如 何 做 HTTP 请 求 以 获取 节点 0 (Adam) 的 详细 信息 ， 以 及 部 分 啊 应 结果 ， 包 括 可 用 扩展 的 一 个 列表 。 
【程序 10-14】 ”获取 Adam 市 点 信息 的 HTTP 咽 应 的 扩展 程序 片段 
Logical HTTP Request 


GET http://localhost:7474/db/,data/node/d0 
Accept: application,/]json 


HTTP Response 原 竺 器 手 件 扩展 列 
200: OK 表 基 于 的 JSON 鱼 | 
Content-Type: application/json 谷 户 端 可 以 用 于 查找 URL 
I 相对 于 这 一 特困 节操 执行 
个 插件 的 包 字 (相应 于 
Hself" : "http://localhost:7474/,db/data/node/o0', 程序 10-13 中 的 者》) 
"extensions" : 1 


"JFriendNamesServerPlugin" : { 
lqget friendnames starting with J" 


"http://localhost:7474/db/data/ext/JFriendNamesServerPlugin/ 
node/0/get friendnames starting with j" 


| 
| ， 


惑 像 在 本 节 的 开始 列举 编号 的 步 又， 创建 一 个 JAR 文 件 需要 包含 插件 类 和 org.neo4j.server.plugins.ServerPlugin 文 件 ， 瓯 
像 下 面 的 程序 片段 所 示 (在 META-INF/services 目 录 中 ) 。 


com.:manning.neo4]j]lia.chapterl0.serverplugin.JFriendNamesServerPlugin 
这 个 JAR 文 件 应 该 放 在 服务 器 的 类 路 径 。 通 党 是 通过 把 这 个 JAR 文 件 放 在 服务 器 安 闭 位 置 的 插件 目录 实现 的 。 


这 个 服务 器 插件 执行 的 结果 的 详细 情况 如 表 10-7 所 示 ， 这 实际 上 是 使 用 本 机 的 藤 入 式 APl。 再 一 次 ， 相 对 于 普通 的 REST 
APIl， 有 了 一 个 很 大 的 改进 。 


表 10-7 场景 3 服务 器 插件 执行 后 的 性 能 指标 日 志 


ae curl i Java REST 二 
602 


1 上 原 妃 REST API 5726 司 秒 | 5303 a 1066 吝 秘 | 9817 i 
Cypher 调用 1 740 训 秒 45 毫秒 | 104 毫秒 | 32 毫秒 
3 服务 器 插件 1 147 毫秒 20 至 秘 76 毫秒 16 毫秒 
站 非 托 管 扩 展 


10.5.4 非 托管 扩展 


如 果 你 需要 完全 控制 你 的 服务 器 端的 代码 ， 那 么 非 托 委 扩展 可 能 正 是 你 要 找 的 。 与 服务 器 插件 仪 允许 你 在 特定 的 点 增强 已 有 
的 REST API 不 同 ， 非 托管 扩展 实质 上 允许 你 定义 目 己 的 特定 域 RKEST API。 不 仅仅 是 处 理 节 点 和 关系 ， 假 如 你 做 出 这 样 的 选择 ， 
现在 你 能 够 处 理 用 户 和 


Neo4j 通 过 允许 部 署 任意 的 JAX-RS ( 专 对 REST 的 网 页 服务 Java APl) 类 到 服务 器 使 得 这 个 成 为 可 能 。JAX-RS 提 供 了 一 组 
APIl， 这 组 APl 是 为 了 使 开发 者 开发 REST 服 务 成 为 一 件 很 简单 的 事 而 提出 的 。 一 般 来 说 ， 你 通过 一 组 注释 定 义 一 个 Java 类 ， 绑 定 
这 个 类 到 Neo4j 服 务 器 内 得 到 一 个 特定 URL 模 式 和 安装 点 。 当 这 个 安装 点 被 调用 时 ， 将 控制 传递 给 这 个 类 ， 这 可 以 完全 访问 
Neo4j 图 形 数据 库 ， 返 回 期 望 的 任意 格式 的 数据 。 尽 管 仍 然 需要 通过 HTTP 协 议 ， 数 据 格 式 并 不 局 限于 JSJON 和 HTML， 就 像 使 用 
REST API 和 服务 器 插件 一 样 。 


© 


忠 


人 钙 
| 


非 托 管 扩展 从 本 质 上 给 你 非 限 制 性 访问 使 用 和 支配 Neo4j 服 务 器 资源 。 这 是 极其 强大 的 功能 。 但 是 ， 你 需要 谨慎 小 心 别 出 意 
外 以 伤害 到 自己 。 这 可 能 由 于 执行 共 种 类 型 的 复杂 遍历 消耗 了 所 有 的 JVM 扒 空间 而 出 现 。 假 设 你 理解 你 正在 做 什么 ， 这 可 能 是 你 
工具 箱 里 的 强 有 力 工具 ， 但 俗话 说 : 权力 越 大 责任 越 大 ! 


下 一 个 程序 给 出 了 一 个 基于 他 们 的 名 字 查 找 一 个 用 户 的 非 托管 扩展 的 实现 ， 后 来 返回 了 这 个 用 户 所 有 名 字 以 J 开头 的 直接 朋 
友 。 


【程序 10-15】 ”一 个 非 托管 扩展 


@Path{ "/example" | < 

public class JFriendNamesUnmanagedExt | 开始 URL 的 一 部 分 ， 在 这 其 
中 这 个 功能 将 会 起 作用 

private final GraphDatabaseService database; 

private static final Label PERSON = DynamicLabel .label ("Person").; 


Public JFriendNamesUnmanagedExt ( 


> : baceeervice 注 四 到 类 所 六 六 
BContext GraphDatabaseService database ) < baseService 注入 到 类 ， 所 供 对 
{ 数据 库 的 完全 访问 
this.databasgse = databage,. 

淋 羽 员 应 HITF 在 URL 模式 的 剩余 路 径 ， 方 法 中 定 

的 GET 方法 y 

ke = a ds i: ee : 和 
®@Path( "/user/iuserid|l/jfriends" ) < 义 的 函数 将 会 显露 


名 (3 


BProducesl MedlaType .APPLICATION JSON | pt i i 
将 会 导致 以 JSOMN 的 肉 容 类 型 响 


Public Response getJFriends! PathPraram!(! "userid" }) String userld ) 


| 
锯 宇 由 护 定义 List<String> namee = aull: z | 
二 人、 try _ (Transaction tx = database.beginTx()}) | 
时 USerid 受 Node theUser = database.,findNodesByLabelAndProperty 
量 中 指定 的 任 PERSON, "userId", USserId) 
何 数值 到 Java -lteratortl next (); 
userid 野性 以 在 names=JFrienderaphHelper.extractJFriendNamesFromRawaAPl (theUser).,; 
方法 内 使 用 二 
ObjectMapper mapper = new ObjectMapper'():; | ie 
String jsonstring = mapper,.writeValuehsstring (names):; TA 
return Response.status! Status .OK ) .entity(ljsonstring ) ,build'):; 
1 
J 


由 于 具有 服务 器 插件 ， 这 个 类 需要 是 一 个 JAR 文 件 并 使 其 对 Neo4j 服 务 器 可 用 。 按 惯例 ， 这 是 通过 把 JAR 文 件 放 在 Neo4j 服 务 
器 的 插件 目录 中 实现 的 。 


另外 ， 你 将 会 需要 添加 和 了 映射 在 neo4jserver.properties 文 件 中 的 任何 非 托管 扩展 到 
org.neo4j.server.thirdparty jaxrs_ classes 键 (通常 可 以 在 Neo4j 服 务 器 安装 的 conf 目 录 中 找到 ) 。 这 个 映射 是 由 定义 包含 扩展 
类 的 Java 包 构成 的 。 下 面 的 程序 片段 是 映射 这 个 到 基础 安 六 点: 


站 工 可 . 如 所 口 和 4 .server,thirdparty Jaxrs classes=cCom,manning.neo4jia.chapterl0 .unman 


agqedext=/n41ia/unmanageq 


这 意味 着 执行 这 个 d 睹 管 扩展 并 且 获 得 Adam 的 名 字 以 J 开头 的 所 有 朋友 ， 你 需要 针对 http://localhost: 
7474/n4jia/unmanaged/example/user/adam001/jfriends 友 出 一 个 HTTP GET。 


表 10-8 给 出 了 程序 10-15 中 的 非 托管 扩展 与 其 他 到 目前 为 止 你 已 经 看 过 的 方法 的 对 比 。 


表 10-8 场景 4 非 托管 扩展 的 性 能 指标 日 志 


url 客户 端 Java REST 缉 定 


兴 调 用 | 热 油 甩 


1 原 姑 RESTAPI 5726 毫秒 | 5303 毫秒 | 1066 毫秒 | 917 毫 秘 
2 Cypher 调用 ] 740 毫秒 45 毫秒 | 104 毫秒 32 毫 各 
3 服务 器 插件 147 毫秒 20 训 秒 75 毫秒 16 毫 各 
- 韭 托 党 扩展 158 毫秒 20 毫秒 | 119 毫 种 18 毫秒 


除 提 供 另 一 个 改进 服务 器 性 能 的 机 制 以 外 ， 非 托管 扩展 还 提供 了 另 一 个 好 处 ， 人 允许 定义 一 个 域 特定 的 REST API 以 及 一 个 使 
用 任何 数据 交换 格式 的 能 力 ， 这 些 格式 包括 JSJON、 二 进 制 、 文 本 或 者 你 选 定 的 其 他 格式 。 然 而 ， 我 们 重申 我 们 的 警告 ， 这 一 强 
有 力 的 工具 需要 谨慎 地 进行 管理 ， 免 得 你 不 经 意 间 打开 了 “潘多拉 魔 盒 ”。 


10.5.5 ” 流 REST API 


从 Neo 征 1.8 版 本 起 ，“ 流 ”的 选项 和 对 REST 请 求 的 JSON 响 应 被 介绍 为 男 一 种 改进 Neo4 REST API 性 能 的 方法 。 黑 认 的 情 
况 下 ， 流 是 天 挥 的 。 


目前 ， 从 客户 端的 角度 ， 所 有 使 结果 流 回 的 需求 是 提供 一 个 扩展 的 标题 (X-stream=true) ， 如 图 10-8 所 示 。 
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图 10-8 ”打开 或 关闭 流 的 结果 


注意 这 仍然 是 一 个 新 的 功能 ， 它 可 能 会 经 历 修改 ， 因 为 清晰 的 使 用 模式 会 出 现 并 且 API 在 不 断 友 展 。 现 在 ， 我 们 不 会 过 论 得 


为 了 演示 通过 使 用 流 API 获 得 的 额外 性 能 改进 ， 我 们 执行 一 个 Cypher 查 询 ， 返 回 例 子 中 的 数据 库 的 所 有 节点 。 我 们 添加 了 额 
外 的 120000 个 节操 产生 数据 ， 共 出 现 120602 个 节操 ， 包 括 Adam 和 他 在 已 有 数据 库 中 的 朋友 。 流 的 结果 大 约 是 149MB 的 数据 量 
用 时 14 秒 ， 而 168MB 的 数据 量 用 时 21 秒 。 


全 注意 


有 效 载荷 比较 小 是 因为 流 的 结果 在 送 回 时 压缩 了 (空白 的 地 方 删除 了 ) 。 流 也 能 减少 服务 器 执行 这 一 工作 需求 的 内 存量 。 因 
为 请 求 的 数据 在 从 数据 库 读 出 的 时 候 直接 流 回 了 客户 端 ， 在 这 个 过 程 中 没有 经 过 临时 存储 任何 节点 或 关系 对 象 ， 从 而 使 得 上 述 情 


况 成 为 可 能 。 


10.6 ”本 音 小 结 


你 已 经 看 到 了 谱 入 式 模式 和 服务 器 模式 这 两 种 方式 如 何 提供 访问 以 及 与 Neo4j 数 据 库 交互 的 功能 ， 但 是 完成 其 工作 的 方式 是 


完全 不 同 的 。 


对 于 嵌入 式 模式 ， 你 与 Neo 和 j 之 间 有 一 个 相当 友好 的 关系 ， 这 仅仅 是 对 Java 和 其 他 几 种 基于 JVM 的 语言 是 可 以 的 。 尽 管 你 能 够 
直接 对 所 有 的 Neo4j 低 层 API 进 行 访问 并 且 能 够 增强 与 这 一 模式 相关 获得 的 性 能 ， 你 也 要 与 Neo4j 共 享 你 的 资源 (内存 等 ) 。 这 可 
能 潜在 的 在 应 用 程序 的 管理 中 引进 一 些 额外 的 开销 和 并 发 症 ， 这 些 是 需要 加 以 考虑 的 。 


在 服务 器 模式 中 ，Neo4j 的 流程 是 隔离 的 ， 并 且 能 够 与 你 的 应 用 程序 彻底 的 分 离 进 行 管理 ， 这 是 在 大 型 分 布 式 结构 中 的 一 个 
很 大 的 成 功 。 然 而 ， 所 有 的 交互 是 通过 REST 提 取 层 实现 的 ， 尽 管 这 会 根据 其 支持 的 客户 端 涉及 广泛 的 网 络 ， 但 会 对 性 能 产生 一 
些 影响 ， 也 需要 对 其 进行 理解 并 进行 适当 的 处 理 。 


这 些 性 能 问题 并 不 是 不 能 解决 的 ， 具 有 像 服 务 器 插件 的 选项 、 扩 展 、 流 和 适当 的 使 用 Cyphet 声 明 ， 都 能 够 帮助 服务 器 模式 以 


更 好 的 性 能 运行 。 


< 


下 一 个 逻辑 查询 是 如 何在 实际 应 用 环境 中 运行 Neo4j 数 据 库 。 现 在 你 已 经 具备 了 所 有 的 基本 知识 ， 但 是 ， 当 你 真正 投入 到 实 
际 生 活 中 时 ， 还 要 考虑 哪些 因素 ? 第 11 章 ， 也 是 最 后 一 章 ， 将 要 讨论 这 一 问题 。 你 将 会 学 习 一 些 涉及 在 真实 的 应 用 环境 中 使 用 
Neo4j 的 应 考虑 的 因素 。 


第 11 章 ”Neo4j 的 架构 与 应 用 


本 章 包 括 以 下 内 容 : 

高 层 Neo4j 架 构 概 述 

. 如 何 准 备 将 Neo4j 应 用 于 实战 中 

. 如 何 扩展 与 配置 Neo4j 使 其 高 可 用 

` 如 何 备 份 与 恢复 Neo4j 数 据 库 

最 后 一 草 涵盖 了 涉及 在 实际 应 用 环境 下 运行 Neo4 笑 的 一 些 更 具 操 作 性 的 问题 。 


这 包括 查看 一 些 诸如 以 高 可 用 性 (High Availability) 模式 运行 Neo4j， 特 别 注意 保证 Neo4j 能 够 以 容错 和 可 升级 的 方式 运 
行 。 为 了 一 些 比较 完善 的 应 用 情况 以 及 提供 如 何 配 制 重要 内 存 和 缓存 设置 的 理解 和 指令 ， 本 章 额 外 包含 了 如 何 备份 和 恢复 数据 
这 将 在 决定 Neo4j 运 行情 况 中 起 一 个 很 重要 的 作用 。 


册 


为 帮助 你 在 本 章 中 获得 最 大 的 收获 ， 并 确实 能 从 本 书 中 获得 全 面 的 知识， 这 里 通过 Neo4j 结 构 并 在 肝 些 地 方 探究 了 深层 次 的 
东西 ， 开 始 一 个 高 水 平 的 旅程 。 这 个 旅程 的 主要 目的 是 提供 上 下 文 的 连接 以 及 用 于 引进 和 讨论 可 操作 性 和 可 配置 性 问题 的 结构 路 
径 。 它 也 帮助 我 们 回顾 和 加 强 一 些 在 前 面 几 章 讨论 过 的 重点 和 重要 概念 。 


因此 ， 让 我 们 开始 吧 ! 


11.1 高层 Neo4j 架 构 


与 任何 的 数据 库 一 样 ，Neo4j 也 有 许多 设置 一 一 为 了 指示 或 影响 数据 库 如 何 操作 和 执行 ， 可 以 使 用 把 手 和 拉杆 进 
行 “ 推 或 “ 打 ”。 我 们 可 以 提供 一 个 可 使 用 的 设置 和 选项 位 置 的 简单 列表 ， 但 是 我 们 希望 你 通过 本 章 获得 更 多 的 知识 ， 而 不 是 
仅仅 知道 哪里 可 以 改变 。 理 想 的 情况 是 我 们 希望 你 获得 一 点 点 Neo4j 的 机 制 感觉 Neo4j 是 如 何在 内 部 工作 的 一 种 基本 感觉 。 
这 将 使 你 理解 为 什么 进行 某 些 设置 将 引起 Neo 有 以 这 样 的 万 式 工 作 ， 而 不 是 仪 仪 知道 菏 一 种 特定 设置 的 存在 。 

机 械 和 谐 

机 械 和 谐 是 一 种 隐喻 ， 它 在 计算 机 领域 获得 了 流行 。 通 常 使 用 它 传 递 想法 以 达到 最 佳 的 利用 工具 或 最 适当 的 利用 系统 (在 这 
里 是 Neo4j) ， 理 解 它 的 工作 机 制 将 给 予 你 帮助 。 然 后 你 可 以 以 最 合适 的 方式 使 用 这 一 知识 。 

原始 隐喻 的 本 身 归 因 于 方程 1 赛车 司机 Jackie Stewatt， 他 被 公认 曾经 说 过 为 了 成 为 最 伟大 的 赛车 手 ， 你 必须 与 你 的 赛车 具有 机 
械 和 谐 。Stewatt 相 信 最 好 的 表现 来 自 于 赛车 手 与 赛车 完美 和 谐 的 工作 结果 。 

当 在 描述 LMAX 团 队 如 何 实现 高 流通 量 干 扰 模 式 的 低 延 迟 时 ，LMAX 架 构 的 Martin Thompson 任 和 借 是 第 一 个 在 计算 意义 上 推广 
使 用 这 一 隐喻 的 人 而 闻名 (就 我 所 知 ) 。 他 对 这 一 隐喻 的 使 用 可 以 在 “LMAX- 如 何在 小 于 1 毫秒 延迟 做 100K TPS” 演 讲稿 中 看 


到 ， 该 演讲 稿 可 以 在 www.infoq.com/presentations/LMAX 网 站 中 找到 。 


ed 


高 层 Neo4j 结 构 如 图 11-1 所 示 。 对 这 一 结构 的 浏览 将 从 图 的 底部 开始 并 环绕 到 项 部 。 
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表示 呈 有 Neo 的 企业 版 可 用 
图 11-1 高 层 Neo4j 结 构 概 况 
因为 这 是 一 本 入 门 书 ， 我 们 将 无 法 深入 到 Neo4j 内 部 所 有 的 方面 。 我 们 的 目标 是 讨论 深度 足以 帮助 你 欣 黄 和 与 Neo4j 协 调 一 


致 的 工作 ， 而 不 研究 低层 的 细节 。 关 于 Neo4j 内 部 如 何 工 作 课题 的 深层 处 理 参见 jim Webber、lan Robinson 和 Emil Eifrem 的 
《Graph Database》 (图 形 数据 库 ) 的 第 6 章 。 尽 管 这 是 一 本 通用 图 形 数据 库 著 作 ， 第 6 章 使 用 Neo 及 的 结构 作为 一 个 例子 解释 


如 何 建 立 和 实施 一 个 高 性 能 的 本 地 图 形 数据 库 。 另 外 ，Tobias Lindaaker 已 经 做 过 Neo4j 内 部 的 多 次 演讲 ， 其 中 之 一 的 “Neo4j 


内 部 概述 ”可 以 在 这 里 找到 : www .slideshare.net/thobe/an-overviewof-neo4j-internals。 


11.1.1 设置 场景 


现在 到 了 应 该 将 应 用 程序 投入 到 实际 工作 中 的 时 人 息 了 。 从 操作 的 角度 看 ， 涉 及 新 型 图 形 数 据 库 时 ， 通 弟 会 有 三 个 主要 的 问 


题 ， 或 三 类 主要 的 问题 。 
- 物理 存储 一 一 需要 什么 类 型 和 多 大 的 存储 ? 
: 内 和 仓 一 一 支持 高 效率 运行 应 用 程序 和 数据 库 需 要 多 少 内 存 和 几 个 CPU? 


可 扩展 性 和 宛 余 一 一 确保 Neo4j 能 够 扩展 以 适应 业务 的 增长 和 高 可 用 性 (或 足够 可 用 ) ， 并 且 确 保 能 够 适当 的 备份 并 在 出 
现 故 障 事件 后 恢复 需要 做 什么 ? 


从 后 往 前 说 ， 恢 复 和 备份 将 在 11.3 节 中 详细 介绍 ，HA 将 在 11.2 节 中 讲解 ， 与 内 存 和 CPU 相关 的 问题 将 在 11.1.4 节 中 介绍 。 
首先 ， 让 我 们 解决 存储 和 硬盘 问题 ， 这 使 我 们 怡 好 回 到 了 Neo 颖 体系 结构 堆栈 的 底层 。 


11.1.2 ”硬盘 


在 Neo4j 体 系 结构 堆栈 的 底层 是 Neo4j 实 际 存储 图 形 数据 库 的 物理 硬盘 。 
1. 应 该 使 用 什么 类 型 的 硬盘 ? 


Neo4j 并 没有 硬性 规定 使 用 什么 类 型 的 硬盘 ， 但 是 不 言 而 喻 ， 在 需要 硬盘 输入 输出 时 ， 速 度 快 的 硬盘 运行 得 快 。 使 用 低 寻 址 
时 间 的 硬盘 (例如 固态 硬盘 ， 也 称 为 99Ds) 通 当 会 比 传统 机 械 式 硬盘 提高 10~20 倍 的 读 盘 速度 。 


束 像 将 在 11.1.4 世 学 习 的 ， 你 应 该 尽 可 能 多 的 将 图 形 数 据 库 保存 在 内 存 中 ， 这 样 会 减少 硬盘 的 输入 和 输出 ， 并 帮助 Neo 和 以 
最 好 的 状态 工作 。 然 而 ， 在 某 些 情 况 下 ， 你 的 应 用 程序 或 数据 库 将 会 需要 到 硬盘 读 取 数据 ， 至 少 ， 这 会 在 开始 局 动 数 据 库 并 访问 
图 形 数 据 库 不 常用 部 分 时 发 生 。 这 也 会 在 你 的 图 形 数据 库 因 为 太 大 不 足以 调 入 内 存 中 时 友 生 ( 见 11.2.4 节 缓存 分 区 ) 。 


避免 硬盘 输入 输出 是 最 大 化 Neo 生 性 能 的 关键 因素 之 一 ， 当 不 能 避免 硬盘 输入 输出 时 使 用 高 速 硬 盘 是 完全 不 同 的 男 一 个 因 


2. 图 形 数据 库 需 要 多 大 的 空间 ? 
需求 的 空间 数量 显然 取决 于 你 打算 在 Neo4j 中 存储 多 少数 据 和 支持 Neo4j 运 行 操作 需求 的 额外 空间 。 


所 有 Neo4j 的 数据 位 于 一 个 单一 的 、 顶 层 的 Neo4 目 录 中 (默认 的 是 基于 服务 器 安装 的 data/graph.db) 。 这 包括 位 于 一 组 
储存 的 文件 中 (在 11.1.3 节 中 讨论 ) 的 核心 图 形 数据 、 事 物 日 志 (在 11.1.5 节 中 讨论 ) 和 在 其 他 文件 中 的 其 他 内 容 (包括 泰 引 和 
其 他 小 文件 ) 。 


所 有 包含 核心 图 形 结构 的 主要 存储 文件 在 空间 鼎 用 的 数量 上 是 一 致 的 一 它们 有 固定 的 记录 大 小 ， 可 以 帮助 你 估算 最 终 的 
文件 大 小 。 尽 管 这 一 单一 因素 并 不 总 能 准确 地 算出 ， 这 对 计算 核心 数据 库 尺 十 的 需求 是 有 极 大 帮助 的 。 这 有 一 部 分 原因 是 Neo4j 
本 身 有 时 创建 额外 的 文件 作为 它 的 部 分 内 部 运行 时 间 的 优化 ， 它 不 可 以 提前 预期 的 。 系 引 和 标 釜 也 会 占用 较 多 的 空间 。 


你 可 以 基于 对 需求 节点 、 天 系 和 属性 的 估计 做 粗略 的 计算 。 一 般 的 计算 核心 图 形 数据 所 需 空 间 的 公式 是 : 


核心 图 形 大 小 ( 字 节 ) = (节点 数 X 以 字 节 记 的 节点 存储 大 小 ) 十 (关系 数 X 以 字 节 记 的 关系 存储 大 小 ) 十 (属性 数 X 平 均 
每 属性 的 字 节 数 ) 


固定 记录 大 小 将 在 下 节 详 细 讨 论 ， 但 是 ， 在 本 书 的 写作 时 ， 节 点 存储 占用 了 14 字 节 ， 而 关系 占用 了 33 字 节 。 此 外 还 会 有 索 
引 、 事 物 日 志 等 需要 的 额外 硬盘 占用 ， 当 在 计算 需要 的 总 的 硬盘 占用 时 ， 这 些 也 需要 进行 考虑 。 前 面 已 经 说 过 ， 通 常 计算 Neo44 
占用 空间 最 大 部 分 的 核心 图 形 数据 尺寸 相对 比较 简单 。 
Neo4j 硬 件 参 数 计 算 器 


Neo 技 术 提供 了 一 个 在 线 硬件 参数 计算 器 用 以 估算 最 小 的 硬件 配置 需求 ， 给 予 一 组 一 定数 据 的 输入 ， 例 如 ， 期 望 的 节点 数 、 
关系 数 、 属 性 数 、 用 户 数 等 。 这 个 计算 器 不 仅 处 理 硬盘 容量 ， 还 有 内 存 和 一 些 设置 推荐 等 。 


应 该 强调 的 是 这 个 计算 器 只 是 提供 一 个 粗略 的 估计 。 如 果 你 是 在 做 一 个 至 关 重 要 的 项 目 ， 建 议 你 找 合格 的 工程 师 寻 求 更 精确 
的 估算 ， 考虑 更 多 的 其 他 因 亲 。 但 是 对 于 一 个 粗略 的 和 准备 开始 的 计算 ， 这 个 计算 器 一 般 就 足够 了 。 


可 以 在 Neo 技 术 网 站 www.neotechnology.com/hardware-sizing 找 到 硬件 参数 计算 器 。 


11.1.3 ”存储 文件 


Neo4D 存 储 图 形 数据 库 的 不 同 部 分 在 一 组 被 称 为 存储 文件 (store file) 中 。 这 些 存 储 文件 通常 通过 记录 类 型 分 解 一 一 有 证 
点 、 天 系 、 属 性 、 标 签 等 单独 文件 。 这 些 文件 中 的 结构 和 数据 布局 做 了 专门 的 设计 和 优化 以 提供 局 效 的 仓储 格式 ，Neo4j 运 行 时 
引擎 可 以 利用 这 些 格式 提供 在 图 形 数 据 库 中 高 效 查 找 和 遍历 。 核 心 启用 之 一 是 Neo4 按 照 免 奈 引 邻近 原则 存储 数据 。 


免 奈 引 邻 近 原 则 


免 索 引 邻 近 原则 〈 或 属性 ) 是 一 个 幻想 的 术语 ， 是 指 能 够 以 非常 不 同 的 方式 存储 图 形 数据 库 的 数据 。 尤 其 是 ， 每 一 个 节点 在 
数据 库 中 的 存储 有 一 个 直接 的 链接 或 引用 到 它 的 临近 节点 (这些 市 点 直接 与 它 相连 ) ， 并 且 必 须 不 需要 使 用 任何 其 他 的 辅助 结构 
(例如 索引 ) 找到 它们 。 


通过 这 种 方式 存储 数据 ， 当 执行 遍历 时 ，Neo4j 能 够 直接 跟随 指针 连接 节点 和 关系 ， 相 对 于 非 免 索引 邻近 存储 ， 例 如 关系 数 
据 库 ， 这 种 类 型 的 访问 数据 速度 显得 非常 快 。 当 试图 定位 直接 连接 的 节点 时 ， 在 Neo4j 中 不 会 产生 开销 。 非 免 党 引 邻 近 存 储 首 先 
需要 使 用 支持 (索引 ) 结构 查找 哪 一 个 节点 连接 在 第 一 个 位 置 。 只 有 那样 它们 才能 够 访问 这 些 节点 。 免 索引 邻近 原则 允许 查询 时 
间 与 你 想 搜索 多 少 图 形 数 据 成 比例 ， 而 不 是 与 整个 图 形 尺 寸 成 比例 。 


回忆 一 下 第 1 章 中 的 足球 体育 场 模 拟 


“Neo4j 的 速度 秘密 在 哪里 ? 


假设 你 本 人 要 在 一 个 当地 的 小 足球 场 带 领 你 的 拉拉队 为 你 的 球 队 加 油 。 如 果 有 人 问 你 坐 在 你 身边 15 英 尺 以 内 有 多 少 人 ， 你 会 
站 起 来 ， 并 以 最 快 的 速度 数 一 数 你 身边 的 人 。 现 在 设想 你 在 国家 足球 场 看 比赛 ， 有 很 多 观众 ， 你 要 回答 的 是 同一 个 问题 ， 在 你 15 
英尺 以 内 有 多 少 人 。 假 设 这 两 个 足球 场 的 人 数 密度 是 一 样 的 ， 那 你 会 有 大 致 相同 的 人 数 需要 数 ， 所 用 的 时 间 也 会 非常 接近 。 于 是 
可 以 说 ， 不 管 足球 场 能 容纳 多 少 人 ， 你 将 以 预计 的 时 间 把 你 身边 的 人 数 完 ， 因 为 你 只 需要 数 坐 在 你 身边 15 英 尺 以 内 的 人 ， 而 不 用 
去 关心 在 球场 另 一 边 包 厢 里 的 人 。 


一 类 比 提供 了 一 个 实际 演示 一 个 人 如 何 自 然 地 使 用 免 索引 邻近 原则 完成 计数 任务 。 


存储 文件 位 于 主 图 形 数据 库 目 录 中 (默认 是 服务 器 的 data/graph.db) 并 以 neostore 作 为 前 缀 。 表 11-1 给 出 了 Neo4j 使 用 的 
主 存储 文件 以 及 它们 的 一 些 关 键 属性 。 


表 11-1 使 用 的 主 存储 文件 及 相关 的 属性 


存储 文件 名 内 容 


necstore. nodestore. db 


necstore.relationshipstore.db 基 也 
PB 品 和 和 关系 的 简单 属性 ( 原 娘 关联 
字符 串 ) 
数组 属性 的 值 (在 块 中 ) 
Propertystore. db.strings 字符 串 属 性 的 值 (在 块 中 *) 


neostore. PrIop 


neostore-.Ppropertystore.db.arraysneostore.: 


注 : * 抉 尺寸 可 以 使 用 string_block_size 和 array_block_size 的 参数 进行 设置 。 默 认 块 的 大 小 是 120 字 节 和 用 于 管理 的 8 个 字 节 。 


主 存储 文件 具有 一 个 固定 的 或 统一 的 记录 尺寸 〈14 字 世 用 于 节点 、33 字 节 用 于 天 系 等 ) 。 除 在 快速 查找 和 遍历 中 起 重要 作 
就 像 11.1.2 忆 中 提 到 的 ， 国 定 的 长 度 使 得 规划 和 计算 需要 多 少 硬盘 容量 和 内 存 分 配给 你 的 图 形 数据 库 变 得 容易 。 


加 


节点 和 关系 存储 文件 仪 仅 存 储 指 各 其 他 节点 、 关 系 和 属性 记录 的 指针 ， 因 此 可 以 正好 存 到 固定 的 记录 文件 。 另 一 方面 ， 属 性 
的 处 理 有 一 点点 困难 ， 因 为 它们 实际 所 代表 的 数据 可 能 有 不 同 的 长 度 。 尤 其 是 字符 串 和 数组 将 会 有 变化 的 数据 长 度 ， 因 为 这 个 原 
因 ，Neo4j 对 它们 进行 特殊 处 理 ， 将 这 种 动态 变化 类 型 的 数据 仓 到 一 个 或 多 个 字符 串 或 数组 属性 块 。 更 多 的 信息 请 参阅 Neo4j 手 
册 (http://docs.neo4j.org/chunked/stable/configuration-caches.html) 。 细 节 会 在 手册 的 22.6、22.9 和 22.10 节 中 介绍 。 


固定 长 度 记 录 如 何 改进 性 能 ? 
使 用 国定 长 度 的 记录 意味 着 基于 节点 或 关系 编号 的 查找 不 需要 通过 存储 文件 本 身 的 搜索 。 而 是 给 定 一 个 节点 或 关系 编号 ， 可 


以 直接 计 草 出 文件 中 存储 数据 的 起 始点 。 节 点 存储 文件 内 的 所 有 节点 记录 都 是 14 字 节 的 长 度 〈 在 写作 本 书 时 ) 。 节 点 和 关系 编号 


是 数值 型 的 并 在 存储 文件 内 直接 与 它们 的 位 置 相关 。 节 点 编号 1 将 是 第 一 个 记录 ， 节 点 编号 1000 将 是 第 1000 个 。 


点 编号 1000) 。 计 算 这 些 数据 起 始 位 置 的 时 间 复 杂 度 O (1) 远 远 小 于 搜索 一 个 函数 的 时 间 复 杂 度 O (logn) 。 如 果 大 写字 母 D 函 
数 使 你 受到 惊吓 ， 不 要 怕 ， 这 里 所 有 你 需要 理解 的 是 通常 计算 一 个 起 始点 比 搜索 一 个 起 始点 快 得 多 。 当 涉及 大 量 数 据 时 ， 这 也 会 


转变 为 显著 的 性 能 提高 。 


如 果 你 想 查找 与 节点 编号 1000 相 关 的 数据 ， 你 将 能 够 计算 出 这 一 数据 将 会 在 节点 存储 文件 中 从 14000 字 节 开 始 (14 字 节 义 节 


定 记 录 的 大 小 在 为 计 工 一 个 文件 中 相 邻 记录 块 的 存储 位 置 提供 一 个 快速 机 制 中 也 扮演 着 重要 角色 ， 文 件 系 统 缓存 中 〈 见 
11.1.4 节 ) 也 使 用 这 一 快速 机 制 加 载 存储 文件 的 部 分 到 缓存 中 。 


当 涉及 存储 文件 的 结构 时 ， 有 两 个 应 该 注意 的 重要 特性 . 


第 一 个 是 这 些 固定 记录 大 小 可 以 用 作 帮 助 估计 中 心 图 形 文件 将 占据 的 硬盘 空间 ， 因 此 ， 你 的 硬盘 束 需 要 有 这 么 大 (参见 
11.1.2 节 ) 。 


第 二 个 是 这 些 存储 记录 在 涉及 文件 系统 缓存 和 它 是 如 何 工作 时 ， 具 有 1 : 1 的 映射 。 缓 存 将 在 下 一 证 讲解 ， 但 是 基本 文件 系统 
缓存 负责 加 载 这 些 存 储 文件 的 部 分 到 可 用 的 内 存 中 以 便 快速 访问 。 密 切 注意 这 些 存 储 文件 的 大 小 是 一 个 能 够 计算 需要 的 内 存 和 组 
存 需 求 的 很 重要 的 因素 。 


11.1.4 Neo4j 缓 仔 


即使 具有 超 快 的 硬盘 和 Neo 笑 的 高 效 存储 结构 ， 每 当 人 处理 流程 需要 从 CPU 到 硬盘 时 轧 会 出 现 一 个 延 时 和 您 宰 。 如 果 需 要 访问 的 
数据 能 够 放 在 内 存 中 时 ( 某 种 RAM) ， 这样 就 会 减少 甚至 消除 硬盘 的 输入 和 输出 ， 这 种 延 时 惩罚 就 会 大 大 减少 。 当 数据 在 内 存 
的 缓存 中 时 ，Neo4j 会 进行 优化 操作 。 


因此 ， 融 Neo4j 而 言 ， 在 内 人 存 中 是 什么 意思 y” Neo4 使 用 一 个 两 层 缓 仔 案 略 : 文件 系统 缓存 和 对 象 组 仓 。 这 些 缓存 ， 以 及 它 
们 在 单个 服务 器 全 部 内 存 中 的 位 置 如 图 11-2 所 示 。 
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图 11-2 Neo4j 对 内 存 缓 存 的 使 用 


1. 系 统 文件 缓存 


文件 系统 缓存 是 自由 内 存 (还 没有 分 配给 任何 处 理 流程 中 的 内 存 ) 的 一 个 区 域 ， 是 操作 系统 保留 的 提高 文件 读 写 速度 的 内 
仔 。 文 件 系统 缓 仓 使 用 一 种 称 作 内 存 映射 输入 输出 的 万 法 (memory-mapped 10) 。 每 当 一 个 处 理 请 求 一 个 文件 时 ， 文 件 系统 
缓存 检查 是 否 已 经 调 入 。 如 果 没 有 调 入 ， 需 要 的 文件 (或 部 分 需要 的 文件 ) 从 硬盘 中 读 到 内 存 区 域 。 之 后 对 同一 文件 (或 部 分 的 
同一 文件 ) 的 需求 残 可 以 直接 从 内 存 中 访问 ， 通 过 减少 对 物理 硬盘 输入 输出 的 需求 大 大 增加 性 能 。 数 据 的 变化 也 会 写 到 文件 系统 
缓存 ， 而 不 是 直接 写 到 物理 硬盘 。 性 能 的 提升 是 通过 访问 文件 系统 缓存 获得 的 ， 而 不 是 直接 访问 一 个 旋转 的 硬盘 ， 这 会 大 约 快 
500 倍 。 


操作 系统 负责 管理 这 些 内 存 ， 包 括 决 定 什 么 时 间 将 在 缓存 中 的 数据 变化 直接 写 到 物理 硬盘 中 去 。 尽 管 操作 系统 管理 这 些 数据 
什么 时 间 读 出 和 写 入 这 个 缓存 区 ， 人 处 理 过 程 也 可 以 请 求 某 些 文件 或 部 分 的 文件 调 入 这 一 缓存 区 进行 处 理 。 


Neo4j 利 用 操作 系统 的 这 一 特点 (通过 Java NIO 包 ) 有 效 地 从 存储 文件 中 加 载 、 读 出 和 写 入 。 这 提供 了 Neo4j 中 的 第 一 层 
(有 时 称 作 低 层 ) 缓存 功能 . 


如 果 系 统 有 表演 并 且 数 据 只 写 入 内 存 中 而 没有 写 入 硬盘 将 会 友 生 什 么 情况 ? 
如 果 操 作 系 统 控制 文件 系统 缓存 中 的 数据 写 入 硬盘 的 时 间 ， 在 系统 崩溃 事件 出 现时 将 会 发 生 什么 情况 ? 


简单 来 说 ， 这 一 缓存 区 的 数据 就 对 了 。 然 而 ,不 必 害 怕 ， 因 为 Neo4j 使 用 分 离 的 、 持 久 的 事务 日 志 来 确保 实际 写 入 到 硬盘 文 
件 每 一 次 提交 事务 的 实施 。 每 当 一 个 提交 发 生 时 ， 尽 管 存储 的 文件 本 身 可 能 还 没有 实际 更 新 ， 事 物 日 志 总 会 在 硬盘 上 有 数据 。 然 
后 在 系统 前 涡 后 重启 时 可 以 使 用 事务 日 志 〈11.1.5 节 讨论 ) 恢复 数据 。 换 名 话说 ， 这 一 事物 日 志 可 以 用 作 重 建 存储 文件 ， 使 之 与 
上 一 次 提交 时 完全 一 样 ， 并 且 存 储 的 文件 也 会 与 系统 触 满 前 把 数据 直接 写 入 硬盘 的 文件 一 样 。 


2. 配 制 文件 系统 缓存 


理想 情况 下 ， 你 的 目标 应 该 是 加 载 尽 可 能 多 的 持续 图 形 数据 (如 存在 硬盘 中 的 物理 存储 文件 ) 到 内 存 中 。 你 可 以 控制 持续 图 
形 数据 的 哪 一 部 分 和 多 少 加 载 到 内 存 中 。 在 实际 中 ， 由 于 所 有 的 数据 都 存在 文件 中 ， 这 通 当 涉及 查找 这 些 文件 占据 多 少 磁盘 空间 
(或 你 希望 它们 成 为 多 大 的 文件 ) ， 并 试图 为 每 一 个 文件 保留 适当 数量 的 内 存 。 


假设 你 有 一 个 顶层 Neo4j 数 据 库 目录 大 约 占据 了 2.2G 的 容量 ， 有 下 列 的 存储 文件 和 大 小 : 


20M neosteore., nodestore. db 
ae0M neostore.propertystore. db 


.2 neostore.pDpropertystore.db.strings 
0M neostore.relationshipstore. db 


下 面 的 程序 给 出 了 将 会 确保 整个 图 形 数 据 库 能 够 调 入 到 内 存放 在 文件 系统 缓存 中 的 配置 。 这 个 配置 文件 的 设置 显示 了 大 约 
2.5G 的 内 存 ， 人 允许 数 据 大 约 有 10% 的 增加 。 

neostore.nodestore.,.db.mapped memory=22M 

neostore.propertystore.db.mapped memory=66M 

neostore.propertystore.dD,strings.mapped memory=1 ,4 

neostore.relationshipstore.db.mapped memory=1 .DG 


neostore.propertystore.dbh.arrays.mpped memory=0NM 


当 以 服务 器 模式 运行 Neo4 时 ， 这 些 设置 是 在 conf 目 录 中 的 neo4j.properties 文 件 中 指定 的 。 


对 误 入 式 模 式 的 设置 ， 配 置 设 置 可 以 在 数据 库 创 建 时 传 入 ， 或 者 通过 引用 一 个 neo4j.properties 文 件 ， 可 以 从 classpath 的 
基 个 地 方 访问 该 文件 ， 或 者 直接 通过 映射 在 Java 中 引用 。 


你 可 能 已 经 注意 到 了 在 硬盘 的 物理 存储 文件 与 配置 设置 具有 1 : 1 的 映射 。 在 更 宽 的 文件 系统 缓存 区 域 ，Neo4j 确 保 为 每 一 个 
存储 文件 保留 分 离 的 单个 文件 缓冲 缓存 区 ， 因 此 也 允许 基于 每 一 个 存储 文件 做 缓存 配置 。 这 使 得 配置 每 一 个 存储 文件 的 多 少 合 量 
应 该 调 入 内 存 成 为 可 能 。 


不 同 的 应 用 程序 将 会 有 不 同 的 使 用 模式 ， 并 且 独 立 调 试 这 些 缓存 区 使 得 你 能 确保 应 用 程序 运行 的 性 能 足够 好 ， 尤 其 是 在 没有 
足够 的 内 存 调 入 整个 图 形 数据 库 到 内 存 的 时 候 。 


全 注意 


当 我 们 讨论 HA 时 ， 我 们 也 应 该 注意 缓存 分 区 的 概念 ， 这 个 概念 可 以 用 于 帮助 加 载 图 形 数据 的 适当 部 分 到 多 个 计算 机 的 内 存 


在 官方 的 Neo4Dj 手 册 的 “内 存 映 射 输入 输出 设置 ”中 提供 了 内 存 映 射 输入 输出 缓存 的 特定 场景 和 配置 例子 ， 可 以 
在 http://docs.neo4j.org/chunked/stable/configuration-io-examples.html 中 找到 |。 


默认 设置 
在 缺少 用 户 的 配置 文件 时 ，Neo4j 将 会 试图 根据 系统 自己 的 知识 及 给 予 它 的 可 用 内 存 数 量 确定 怎样 的 配置 是 最 好 的 。 
3. 对 象 缓 仔 


文件 系统 经 历 了 一 个 很 长 的 时 间 通 过 减少 硬盘 的 输入 输出 改进 性 能 ， 但 是 Neo4j 是 一 个 基于 JVM 的 应 用 程序 ， 它 能 够 处 理 节 
点 和 关系 的 概念 (作为 Java 对 象 存储 ) ， 而 不 是 仪 仅 与 原始 文件 交互 。 


Neo4j 的 对 象 缓 仔 是 JVM 堆 里 面 的 一 个 区 域 ，Neo4 在 那里 通过 核心 Neo4j API 以 一 种 便于 用 于 遍历 和 快速 恢复 的 优化 形式 
人 存放 Java 对 象 的 节点 和 关系 版 本 。 


前 面 给 出 了 如 何 应 用 文件 系统 缓存 相对 于 访问 旋转 机 械 硬 盘 上 的 同样 数据 提高 500 倍 的 速度 。 对 象 缓存 是 另 一 个 大 大 超过 文 
件 系统 缓存 提高 性 能 的 策略 。 在 对 象 缓存 中 访问 数据 (相对 于 到 文件 系统 缓存 ) 大 约 快 5000 售 。 


4. 配 置 对 象 缓 仔 


配置 对 象 缓存 有 两 个 方面 。 第 一 个 涉及 配置 JVM ， 尤 其 是 JVM 堆 ， 这 可 以 通过 在 启动 时 给 JVM 提 供 适 当 的 -Xmx? ? ? m 参 
数 来 实现 。 第 二 种 方法 是 选择 一 种 适当 的 缓 仓 类 型 ， 这 是 通过 在 neo4j.properties 文 件 中 设置 cache _ type 参数 控制 的 。 


我 们 首先 解决 VM 的 配置 ， 因 为 这 将 会 对 你 的 应 用 程序 和 数据 库 具 有 重大 的 影响 。 一 般 的 经 验 是 尺寸 越 大 越 好 。 因 为 这 意 
味 看 大 的 缓 仔 容 纳 和 处 理 更 多 的 对 象 ， 也 会 使 应 用 程序 获得 更 好 的 性 能 。 这 一 观点 在 大 多 数 情况 下 是 对 的 ， 但 是 并 不 是 总 那么 简 
EE 


基于 JVM 的 友 展 的 一 个 吸引 人 的 特点 之 一 是 作为 一 个 开 友 者 ， 你 不 必 担 心 为 你 的 对 象 分 配 和 释放 内 存 (如 在 其 他 的 语言 
C++ 中 需要 的 ) 。 这 是 由 JVM 动 态 管 理 的 ，JVM 人 负责 对 你 的 对 象 分 配合 适 的 内 仔 ， 以 及 通过 使 用 一 个 垃圾 收集 器 清理 没有 5 引用 
的 对 象 。 垃 圾 收集 器 可 以 调整 和 配置 ， 但 是 ， 一 般 情 况 下 ，JVM 扒 尺寸 大 于 8GB 时 似乎 会 引起 问题 。 


大 的 堆 尺 十 能 够 导致 长 GC 暂 停 和 择 动 一 这 正 是 需要 避免 的 滔 费 时 间 的 类 型 。 长 CC 暂 俘 和 抖动 对 性 能 具有 可 怕 的 影响 ， 
为 当 JVM 结 束 时 将 试图 执行 清理 和 释放 对 象 的 维护 活动 ， 这 要 比 应 用 程序 执行 任何 有 用 工作 人 花费 更 多 的 时 间 。 


因此 ， 应 该 分 配 多 少 内 存 给 JVM 以 便 Neo4j 运 行 的 性 能 最 佳 ” 直到 找到 一 个 合适 的 利用 JVM 堆 空间 尽 可 能 多 而 没有 引起 太 多 
的 与 GC 相关 问题 的 协调 点 之 前 ， 这 是 你 需要 考虑 的 问题 之 一 。 利 用 以 下 的 启动 参数 和 数值 提供 一 个 好 的 开始 点。 


分 配 尽 可 能 多 的 内 存 给 JVM 堆 ( 考 上 处 你 的 计算 机 和 JMV 特定 的 限制 一 一 对 大 多 是 人 来 说 是 6GB 或 更 少 ) ， 通 过 - 


Xmx? ? ? m 参 数 传递 。 
"以 -servet 标 志 启 动 JVM。 
. 使 用 并 发 标记 和 清扫 压缩 垃圾 收集 器 而 不 是 默认 配置 的 JVM， 使 用 -XX: +UseConcMarkSweepGC 参 数 。 


关于 在 Neo 儿 中 基于 JVM 和 基于 GC 的 性 能 优化 的 详细 讨论 请 参阅 官方 手 
有 册 http://docs.neo4j.org/chunked/stable/configuration-jvm.html。 


创建 一 个 早期 的 样本 图 形 数据 库 以 帮助 决定 内 存 (和 硬盘 ) 的 需求 


没有 一 个 通用 的 简单 和 完全 精确 的 方法 准确 计算 JVM 将 会 需要 内 存 中 多 大 的 堆 空间 来 容纳 和 处 理 图 形 数 据 库 。 许 多 人 选择 先 
建立 一 个 小 的 ,但 是 相对 精确 (如 果 有 可 能 的 话 ) 的 在 开发 过 程 中 尽 可 能 早 的 样本 图 形 数据 库 。 即 使 这 一 样本 图 形 数 据 库 将 随 着 
时 间 的 进程 发 生变 化 ， 但 是 它 也 能 帮助 解决 具有 同样 结构 和 访问 模式 的 大 型 数据 集 可 能 需要 的 空间 和 内 存 。 


这 对 解决 文件 系统 缓存 、 对 象 缓 存 和 通用 存储 需求 的 合适 设置 是 有 用 的 。 


第 二 个 设置 是 neo4j.properties 文 件 中 的 cache type 人 参数 设置 。 这 将 控制 节点 和 关系 对 象 是 如 何 调 入 缓 仔 的 。 为 了 简化 ， 我 
们 将 列 出 在 官方 手册 中 具有 简单 描述 的 可 用 选项 ， 如 表 11-2 所 示 。 更 多 信息 请 参阅 Neo4j 手 册 中 的 “Neo4j 中 的 缓存 ”一 


节 http://docs.neo4j.org/chunked/stable/configuration-caches.html, 


表 11-2 ”按照 官方 文档 的 对 象 缓存 类 型 选项 


缓存 类 型 描述 
于 后 于 所 不 使 出 En 屋 履 在 ， 闪 有 对 音调 . 信 缓存 
st 对 可 用 的 内 存 提供 优化 的 使 用 。 适 用 于 高 效 的 遍历 。 如 果 上 频繁 访问 的 图 形 数据 库 部 分 设 有 放 进 组 


存 中 时 ， 在 高 强度 的 调 人 下 ， 可 能 导致 GC 问题 
对 缓存 的 对 象 提供 短 的 生命 周期 。 适 应 于 高 输入 和 高 输出 量 的 应 用 程序 ， 这 里 图 形 数据 库 的 较 大 


所 已 上 和 让 ee a 
部 分 比 能 够 调 人 内 存 的 图 形 访问 的 次 数 高 
[ 琶 ) 
绎 存 类 型 描 访 
strong | 保留 调 人 到 缓存 的 所 有 数据 并 且 不 再 释放 它 。 如 果 你 的 图 形 小 到 足以 放 进 内 存 ， 提 供 优 秀 的 性 能 
i 是 供 了 一 -种 方法 指定 一 定数 量 的 内 存 作为 加 载 的 节点 和 关系 的 缓存 。 动 作 不 大 但 能 快速 插 人 或 查 


找 。 大 名 数 情况 下 是 最 佳 的 选择 。 是 一 种 高 效 缓 存 
注 : * 上 默认 缓存 类 型 
#*# 仅 在 Neo4j 的 企业 版 中 可 用 。 ( 注 : 一 些 用 户 已 经 成 功 的 使 用 这 类 缓存 至 堆 尺寸 多 达 200G) 


随 着 JVM 堆 尺寸 的 不 断 增加 ， 它 几乎 要 占用 了 所 有 可 用 的 内 存 ， 堆 尺 寸 的 设置 和 文件 系统 缓存 的 设置 应 该 放 在 一 起 考虑 。 
记 住 也 要 包括 其 他 的 因素 ， 例 如， 操作 系 统 对 内 存 的 需求 和 其 他 任意 运 行 的 流程 。 如 果 你 是 在 以 藤 入 式 模 式 运 行 ，Neo4j 数 据 库 
将 会 与 你 的 主机 应 用 程序 共享 JVM 堆 ， 因 此 ， 应 确保 也 考虑 这 个 因素 。 


5. 缓 仔 总 结 
缓存 方式 可 以 忌 结 如 下 : 
. 最 低 目标 是 设置 将 全 部 或 尽 可 能 多 的 图 形 调 入 文件 系统 缓存 中 。 


: 然后 ， 尽 量 多 使 用 对 象 缓存 。 
11.1.5 ”事务 日 志 及 可 恢复 性 


转 到 我 们 的 高 层 结构 图 的 右边 ( 见 图 11-3) 。 我 们 将 重点 放 在 提供 一 个 事务 日 志文 件 (有 时 也 会 揭 的 是 逻辑 文件 ) 如 何 用 
于 确保 Neo4j 与 ACID 的 兼容 的 简单 回顾 。 但 是 本 章 更 重要 的 是 看 看 如 何 使 用 事务 日 志 提 升 目 身 的 修复 和 恢复 。 


> i 
访问 图 形 数 据 库 的 是 有 历 API Cypher | 
潭 枉 API ] 


忙 心 API 


高 可 用 功能 提供 
定制 厅 和 性 种 础 往 


改进 性 能 的 
| | 本 上 re i BE | 


机 个 可 用 选项 


包含 图 撒 结 构 各 个 | 
方 国 时 在 入 证 和 尾 


出 存 图 撒 妆 撕 库 
籽 怕 1 :让 型 汀 型 础 再 
则 村 要 到 市 正品 硼 转 A | 


包含 提交 了 的 事务 交 件 ， 

用 于 确保 与 ACID 的 兼容 和 

提供 当 需 要 时 恢复 数据 库 的 
此 力 


表示 具有 Neodj 国企 业 ho] 有 


图 11-3 ”事务 日 志 在 整 个 Neo4 和 结构 中 的 位 置 回 顾 


在 第 7 章 ， 我 们 知道 了 Neo4j 是 一 个 完全 兼容 ACID (原子 性 、 一 致 性 、 隔 离 性 和 持久 性 ) 的 数据 库 。 许 多 基于 ACID 的 系统 
(包括 Neo 儿 ) 使 用 称 作 预 写 日 志 (WAL) 作为 机 制 提供 ACID 方面 的 原子 性 和 持久 性 。 预 写 日 志 的 使 用 意味 着 每 当 提 交 一 个 事 
务 ， 所 有 的 数据 变化 在 应 用 于 存储 文件 本 身 之 前 写 入 (物理 刷新 ) 硬盘 中 激活 的 事务 日 志文 件 中 。 回 忆 一 下 使 用 文件 系统 缓 仔 意 
味 着 写 到 存盘 文件 仍然 可 能 也 在 内 存 中 一 一 操作 系统 负责 决定 什么 时 间 将 内 存 的 这 些 区 域 写 到 硬盘 中 。 但 是 即使 系统 月 省 并 且 

提交 了 的 变化 还 没有 写 到 物理 存盘 文件 ， 这 些 存 盘 文 件 也 会 使 用 这 些 事务 日 志文 件 进行 恢复 


所 有 的 事务 日 志文 件 可 以 在 Neo4j 数 据 库 的 项 层 目 录 中 找到 ， 并 且 具 有 以 下 格式 的 文件 名 nioneo _logical.log.*。 
韭 正常 天 闭 的 后 台 恢 复 


非 正 常 关 闭 通 常 是 指 一 个 Neo4j 实例 的 意外 前 渍 。 也 可 能 是 指 Neo4j 的 有 意 关 闭 ， 但 是 关键 点 是 ， 不 管 是 什么 原因 ，Neo4j 没 
有 执行 它 的 正常 结束 活动 。 当 一 个 非 正 常 关闭 出 现时 ， 下 面 的 警告 信息 会 在 下 一 次 数据 库 启动 时 在 日 志 中 看 到 
shutdown detected (检测 到 非 正 常 的 关闭 ) 。 


non clean 


当 Neo4j 启 动 时 ， 它 要 做 的 第 一 件 事 是 查阅 最 近 的 事务 日 志 ， 并 且 重 做 发 现 的 所 有 针对 实际 存盘 文件 的 所 有 事务 。 有 可 能 
些 事务 已 经 应 用 到 了 存盘 文件 中 〈 记 住 是 操作 系统 控制 什么 时 间 文 件 系 统 缓存 写 入 硬盘 ， 这 可 能 已 经 发 生 或 没 发 生 ) 。 然 而 ， 重 
新 再 一 次 做 这 些 事物 不 会 出 现 问题 ， 因 为 这 些 动作 被 看 作为 知 等 的 ， 即 这 些 变 化 可 以 被 多 次 应 用 而 不 会 导致 图 形 数据 库 中 的 不 同 
结果 。 


一 旦 Neo4j 实例 已 经 启动， 它 的 存盘 文件 将 会 完全 恢复 并 且 包 含 所 有 指向 的 事务 和 最 后 的 提交 ， 给 你 做 好 了 继续 工作 的 准 
备 ! 


除了 帮助 事务 和 恢复 性 外 ，HA 的 功能 也 是 基于 


9 能 力 。 


志 建 


11.1.6 ”编程 API 


在 Neo4j 结 构 的 最 顶层 是 三 个 主要 的 API (Cypher、 驳 历 和 核心 ) ， 用 于 访问 和 处 理 Neo4j 中 的 数据 ( 见 图 11-1) 。 前 面 的 
章节 已 经 深入 讨论 了 这 些 API1， 因 此 这 里 我 们 不 再 讨论 。 


从 技术 上 讲 ， 这 些 APl 没 有 任何 的 操作 问题 ， 也 没有 像 组 存 一 样 的 方式 做 特殊 的 设置 来 调节 这 些 API。 它 们 确实 组 成 了 你 
在 经 历 的 整个 Neo4j 的 结构 ， 因 此 在 这 里 特别 提 到 它们 。 


只 有 一 样 乐 西 在 本 蔬 中 我 们 要 进行 强调 ， 尽 管 这 些 APl 中 的 每 一 个 都 能 被 独 立地 用 于 与 图 形 数据 库 进 行 交 马 ， 从 肝 种 程度 上 
它们 是 建立 在 相互 的 基础 上 的 (有 一 点 像 堆 的 方式 ) 。 更 重要 的 是 ， 它 们 每 一 个 都 有 目 己 的 适应 点 ， 具 体 取决 于 你 想 做 的 事情 ， 
即 由 你 来 选择 合适 的 工具 完成 工作 。 图 11-4 给 出 了 主要 目标 和 每 一 个 API 使 用 的 方法 的 概况 。 


本 时 API 用户 控 殿 甩 接 的 “日 杯 


作为 控制 地 过 图 形 的 明 历 ， 当 着 崇 


时 有 具有 使 用 必需 的 【核心 1) API 的 Cypher AP1l 声明 : 用 户 提供 
能 力 来 更 由 多 地 进行 控制 “模式 ”作为 控制 如 何 遍 历 
相 与 图 形 进行 要 日 的 万 去; 
网 如 : 
-wr Cvypher 
vou) = [:USE] 
-> (CYPhNner) 
NN 3 -> :TALK TO => 
(grapn) 


必需 的 API: 期 望 用 户 对 低层 
图 形 数据 的 布局 有 一 个 准确 的 
理解 并 提供 显 式 的 指令 指出 如 
何 与 低层 图 形 交 互 


图 11-4 编程 API 栈 


如 果 性 能 是 最 重要 的 ， 你 或 许 会 选择 深入 底层 使 用 核心 APl， 因 为 这 会 提供 最 灵活 的 性 能 和 对 图 形 交 互 的 控制 。 这 是 有 代价 
的 ， 因 为 这 需要 对 图 形 数据 的 布局 有 一 个 准确 的 把 握 ， 以 便 与 之 交互 ， 并 且 这 种 交互 可 能 是 相当 详细 的 。 


饥 历 AP 是 一 个 稍微 友好 的 AP1， 在 这 里 用 户 给 出 目标 ， 例 如 “做 一 个 到 深度 3 的 深度 优先 搜索 ”， 人 允许 Neo 浊 关注 与 核心 
API 的 交互 以 实现 结果 。 尽 省 这 个 API 对 开 友 者 而 言 是 比较 容易 使 用 的 ， 但 是 略 高 一 层 的 抽象 意味 着 它 可 能 没有 像 执 行 核心 API 一 


样 达到 最 佳 。 


然后 残 是 Cypher 一 一 声明 的 、 人 性 化 图 形 查 询 语言 ， 并 且 可 以 说 是 所 有 API 中 在 使 用 方面 最 和 直观 和 最 友好 的 。 许 多 人 会 说 
Cypher 代 表 了 Neo4j 的 未 来 ， 因 此 很 多 的 开发 努力 都 集中 人 在 了 这 一 领域 。 其 吸引 力 和 易于 使 用 与 理解 性 (针对 开 友 者 和 操作 人 
员 ) 使 得 它 成 为 Neo4j 产 品 中 具有 令 人 信服 的 优势 。 目 前 ， 在 大 多 数 情况 下 ，Cypher 的 性 能 不 如 核心 API。 人 在 Neo4j 1.x 
中 ，Cypher 绑 定 到 核心 和 遍历 API (因此 ， 它 绝 不 能 做 的 比 那些 API 更 好 ) ， 但 是 在 未 来 (尤其 是 从 Neo4j 2.0 往 后 ) ，Cypher 
将 会 绑 定 到 标的 较 低 层 的 一 个 相 协调 的 API 上 ， 这 将 会 广 持 优化 查询 和 其 他 的 运行 效率 。 尽 管 目 前 Cypher 在 性 能 上 还 不 能 与 核心 
APl 相 比 ， 但 是 没有 理由 认为 它 不 会 在 将 来 与 核心 API 看 齐 或 者 超过 核心 API 一 一 时 间 会 说 明 一 切 。 


11.2 ”Neo4j 的 高 可 用 性 


企业 版 的 Neo4j 具 有 一 个 Neo4j HA 部 件 ， 这 个 部 件 为 Neo 和 提供 运行 群 设置 的 能 力 ， 人 允许 你 将 数据 库 分 布 在 不 同 点 的 电脑 
。 Neo4j 使 用 主 从 复制 结构 ， 广 义 地 说 ， 提 供 了 支持 两 个 关键 特色 的 能 力 : 在 硬件 故障 时 的 应 变 能 力 和 容错 能 力 ， 扩 展 Neo4 


读 密 集 型 数据 场景 的 能 力 。 


HA VS 集群 


当 在 Neo4j 中 做 多 台电 脑 的 设置 时 ， 你 将 会 经 常 听 到 HA 和 集群 这 两 个 术语 可 以 互 换 。 在 本 质 上 ， 它 们 是 指 同样 的 概念 ， 只 是 
名 字 不 同 。 


弹性 和 容错 是 指 即 使 在 网 络 中 断 或 者 硬件 故障 时 ，Neo4 继 续 为 客 尸 提供 服务 的 能 力 。 如 果 集 群 中 的 一 台电 脑 坏 了 ， 或 者 网 
络 连接 断 了 ，Neo4j 应 该 能 够 继续 提供 服务 ， 而 不 是 完全 失去 服务 的 能 力 。 


除了 能 够 处 理 硬 件 故 障 之 外 ， 主 从 结构 具有 一 个 额外 的 好 处 ,提供 了 一 个 横 同 扩展 Neo 笑 的 方法 读 密 集 型 数据 的 场景 。 在 这 
里 ， 读 密集 型 数据 场景 可 以 指 当 有 需要 或 有 期 待 时 具有 高 告 吐 量 的 应 用 程序 ， 在 多 个 从 实例 中 横 同 扩展 读 取 数据 。 它 还 支持 缓存 
分 区 (将 在 11.2.4 节 中 讨论 ) ， 使 得 Neo4j 能 够 处 理 比 单个 Neo4j 实 例 更 大 的 读 载 荷 。 


11.2.1 ”Neo4j 集 群 概述 


Neo4 HA 集群 涉及 一 系 风 Neo 有 企业 版 实例 ， 这 上 绎 实例 锌 配置 到 属于 单一 的 逻辑 单元 (和 群 ) 。 在 任何 的 给 定时 间 ， 期 望 忌 
有 一 个 处 于 主导 地 位 ， 根 据 需 要 设置 没有 或 有 多 个 从 实例 的 集群 。 


Neo4j HA 结构 最 近 经 历 了 大 的 改进 ， 以 简化 设置 和 操作 运行 的 需求 。 在 Neo4j 1.9 版 本 之 前 ，Neo4j 使 用 Apache 
ZooKeeper (http://zookeeper.apache.org) 提供 集群 协调 功能 。 尽 管 ZooKeeper 是 一 个 优秀 的 产品 ， 但 是 在 Neo4j 的 使 用 中 
出 现 了 很 多 问题 ， 包 括 不 得 不 处 理 操作 的 额外 开销 、 设 置 和 集成 一 个 分 离 的 协调 部 件 。 在 目 动 配置 其 本 身 时 也 具有 限制 ， 在 一 些 
基于 云 的 设置 中 证 实 了 具有 有 某 些 限制 。 


由 于 这 些 以 及 其 他 一 些 原因 ，Neo 技 术 决 定 推出 目 己 的 集群 协调 机 制 ， 并 且 从 Neo4j 1.9 版 本 开始 ， 包 括 Neo4j 2.0 版 ， 不 再 
使 用 ZooKeeper。Neo4j 的 实施 是 基于 Paxos 协 议 ， 它 主要 处 理 主 选择 ， 但 是 Neo4j 也 负责 处 理 一 般 的 基于 集群 的 管理 任务 。 它 
不 需要 理解 Paxos 协 议 中 的 细节 (这 大 大 超出 了 本 书 的 讨论 范围 )， 但 是 如 果 你 感 兴趣 的 话 ，Leslie Lamport 的 文章 《Paxos 化 
繁 为 简 (2001) 》 提 供 了 一 个 对 这 个 主题 的 简单 介 


绍 : www.cs.utexas.edu/users/lorenzo/corsi/cs380d/past/03F/notes/paxos-simple.pdf。 
图 11-5 给 出 了 新 的 Neo 笑 集群 协调 机 制 基于 Paxos 协 议 的 工作 情况 。 


在 一 个 Neo4j HA 集群 中 ， 当 每 一 个 数据 库 实 例 遇 到 逻辑 需求 与 群 中 的 其 他 成 员 进 行 协 调和 通信 时 ， 其 自身 是 能 够 自给 自足 
的 。 当 一 个 HA 数据 库 实例 启动 时 ， 要 做 的 第 一 件 事 情 是 建立 到 它 的 配置 集群 的 连接 。neo4j.properties 文 件 包含 不 同 的 属性 来 
控制 HA 配置 (都 以 ha* 为 前 缀 ) ， 包 括 属 于 本 集群 中 成 员 的 开始 设置 列表 中 的 属性 一 一 ha.initial_hosts。 


如 果 启 动 后 不 存在 集群 ， 意 味 着 这 是 第 一 台 试 图 连接 集群 的 计算 机 ， 然 后 这 个 过 程 将 会 建立 开始 的 集群 ， 并 将 这 台 计 算 机 作 
为 集群 的 群 主 。 


集群 管理 


事务 管理 
集 样 管理 


Neo4j HA 
守 例 1( 从 ) 


数据 库 


Neo4j HA 实例 2 = 


ye er 年 . 
= :os ， 


以 HA 模式 运行 Neodj 
需要 总 有 单个 主 ， 没 有 
或 多 个 配置 的 从 Neo4j 实施 了 它 自 己 的 基于 
Paxos 的 集群 管理 ， 它 负责 
与 集群 有 美的 管理 工作 ， 
例如 主 的 选择 ， 实 例 的 自动 


用 入 束 商 升 圭 


数据 的 传输 


图 11-5 在 主 1 和 从 2 中 的 Neo4j HA 群 设置 样 例 


所 有 的 写 请 求 最 终 都 是 通过 主 计算 机 完成 的 ， 尽 管 也 有 可 能 把 请 求 发 送 到 从 计算 机 去 执行 。 然 而 ， 这 样 做 要 比 直接 由 主 计算 
机 做 慢 得 多 。 在 这 种 情况 下 ， 从 计算 机 在 逻辑 上 内 置 了 确保 同步 首先 写 到 主 计算 机 中 ， 然 后 再 写 到 其 自身 。 


数据 的 修改 通过 一 个 可 配置 的 基于 推拉 机 制 的 从 计算 机 传 回 主 计算 机 。 
什么 是 CAP 和 ACID? [1 


以 集群 设置 运行 对 Neo4j 提 供 的 ACID 保证 具有 一 定 影 响 。Neo4j 的 单机 一 致 性 担保 放宽 了 在 一 个 集群 中 的 最 终 一 臻 性。 这 


是 什么 意思 ? 


一 本 NoSQL 书 ， 如 果 没有 谈 到 或 提 到 CAP 定 理 就 不 算 结束 。Neo4j 声 称 是 ACID 兼容 的 数据 库 ， 并 且 当 在 单机 上 运行 时 ， 这 
项 保证 是 绝对 的 。 然 而 ， 一 旦 你 对 数据 库 引 进 了 在 一 个 网 络 上 分 区 的 功能 (通过 主 从 设置 ) ， 完 美的 ACID 保证 (至 少 是 确保 请 
求 收 到 成 功 或 失败 的 啊 应 和 数据 的 一 致 性 方面 ) 需要 放松 或 从 某 一 程度 上 重新 定义 。 


有 一 个 例子 可 以 帮助 你 弄 清楚 这 些 事情 。 因 此 让 我 们 假设 你 的 数据 库 现 在 分 布 到 (复制 到 ) 三 个 实例 中 ， 并 且 更 新 了 其 中 一 
个 (主机) 的 一 个 节点 。 对 于 从 机 将 友 生 什么 事情 ? 当 它 们 中 的 一 个 试图 读 这 一 数据 时 ， 它 是 否 会 马上 读 到 这 一 更 新 的 数据 (是 
否 所 有 的 从 机 都 能 够 在 任何 时 间 读 到 一 致 的 数据 ) 或 是 否 会 有 任何 时 间 数 据 会 失效 ? 如 果 有 了 网络 故障 ， 你 还 能 够 通过 任何 的 计算 
机 ， (包括 从 机 ) 读 和 写 吗 ? 


为 了 这 个 讨论 的 目的 ， 最 初 由 Eric Brewer 在 2000 年 提出 ， 并 在 12 年 后 的 回顾 更 新 的 CAP 定 理 指出 [站 ， 当 涉及 分 区 时 ， 不 能 


在 100% 的 时 间 中 同时 保证 数据 的 一 致 性 和 确保 请 求 收 到 成 功 或 失败 的 咯 应 一 一 需要 有 一 种 权衡 。 

Neo4j 是 一 个 AP 数 据 库 ， 这 意味 着 它 的 最 终 分 区 是 不 可 用 的 (如果 网 络 是 极其 分 散 的 话 ， 为 了 安全 的 原因 ， 它 只 能 是 只 
读 ) 。 从 机 必须 在 经 过 一 段 时 间 推 或 者 拉 更 新 数据 才能 保证 最 终 的 数据 一 致 性 。 这 些 值 是 可 配置 的 ， 因 此 ， 数 据 不 一 致 的 窗口 是 
可 控制 的 ， 是 由 每 一 个 应 用 程序 或 设置 程序 控制 的 。 我 们 将 在 11.2.3 节 中 讨论 。 

在 我 们 更 深入 地 探讨 Neo4j 内 部 某 些 HA 特性 是 如 何 工作 的 更 专业 问题 之 前 ， 先 来 讨论 具有 三 台 计 算 机 集群 的 设置 练习 。 这 
会 帮助 你 锋 炼 动手 能 力 ， 从 而 能 够 设置 并 且 能 做 一 些 设置 选项 的 实验 ， 残 像 我 们 在 本 草 中 讨论 的 这 些 设置 选项 一 样 。 

从 时 机 设置 切换 至 集群 设置 

对 当前 使 用 已 经 存在 的 单机 《〈 误 入 式 或 服务 器 模式 ) 的 客户 ， 切 换 至 集群 环境 应 该 是 一 个 相对 简单 并 不 会 有 痛苦 经 历 的 事 
情 。 这 可 能 是 因为 Neo4j HA 的 设计 从 开始 就 使 这 种 转换 尽 可 能 的 容 这 很 明显 需要 涉及 额外 的 配置 以 确保 服务 器 能 够 将 自身 
建立 为 


» 


易 。 
为 集群 成 员 ( 稍 后 将 讨论 ) ， 但 是 从 客户 端的 角度 ， 同 服务 器 进行 交互 的 可 行 操作 和 一 般 的 方法 应 该 大 部 分 保持 不 变 。 
(1) 沿 入 式 模式 


对 诬 入 式 模式 的 客户 ， 如 果 还 没有 升级 的 话 ，Neo4j JAR 依 赖 需要 从 共享 (Community) 版 升级 为 企业 (Enterptise) 版 。 其 
后 只 需要 修改 GraphDatabaseService 实 例 的 建立 。 而 不 是 使 用 GraphDatabaseFactory 去 创建 GraphDatabaseService， 应 该 使 用 
HighlyAvailableGraphDatabaseFactory。 由 于 这 两 个 factories 产 生 的 实施 使 用 同一 个 GraphDatabaseService 接 口 ， 对 每 一 个 客户 没有 额 
外 的 变化 需求 。 
下 面 的 程序 片段 给 出 了 实际 中 使 用 的 代码 ， 给 出 了 加 粗 显 示 的 HA 特定 变化 。 
qraphDatabaseService = new HighlyAvailableGraphDatabaseFactory!) 
.newHighlyAvailableDatabaseBuilder'"/machineA") 


.loadPropertiesFromFile lmachineAFilename) 


.newGraphDatabase (); 


(2) 服务 器 模式 
当前 没有 运行 企业 版 的 单一 服务 器 实例 首先 需要 升级 到 企业 版 ， 然 后 将 服务 器 配制 成 为 一 个 合适 的 集群 的 一 部 分 是 一 件 很 简 
单 的 事情 。 


11.2.2 ”设置 Neo4j 集 群 


让 我 们 讨论 一 个 具有 三 台 计 算 机 基于 服务 器 集群 的 设置 流程 。Neo4j HA 与 以 嵌入 式 模 式 实 例 工作 类 似 。 由 于 主要 作为 演示 
目的 ,我 们 将 在 同一 台 计 算 机 上 运行 这 三 个 实例 ;但 是 在 实际 中 你 将 更 可 能 在 不 同 的 计算 机 上 运行 不 同 的 实例 。 


四 注意 


这 些 指令 是 对 *nix 环 境 而 言 的 (实际 的 例子 是 在 OS 义 10.9.2 上 做 的 ) ， 但 是 ， 对 于 Windows 的 设置 可 以 仿照 等 效 的 过 程 。 我 


们 是 在 Neo4j 2.0.2 版 本 上 运行 HA 设置 。 
1. 初 始 设 置 
按照 这 些 步 又 做 初始 设置 : 


1) 创建 一 个 根 目 录 ,， 例如 ~/n4jia/clusterexample。 


2) 下 载 Neo4j 的 企业 版 并 解压 zip 文 件 (对 Windows 操 作 系 统 ) 或 tar 文 件 (对 UNIX 操 作 系 统 ) 到 这 一 文件 夹 。 对 于 Mac 操 
作 系 统 ， 这 会 有 点 像 以 下 的 样子 : 


~/n4jia/clusterexample/neo4ij-enterprise-2.0.2 


3) 重新 命名 这 个 文件 夹 为 machine01， 并 且 复 制 这 个 文件 夹 及 其 所 有 的 内 容 到 目录 machine02 和 machine03。 你 的 结果 
文件 结构 应 该 像 这 样 : 


-/n4jia/clusterexample/machine01 
~/n4jla/clusterexample/machined2 
~-/nA4ijia/clusterexample/machine03 


4) 在 每 一 全 计算 机 的 根 目录 内 ， 找 到 conf/neo4j-server.properties 文 件 并 确保 以 下 的 属性 设置 : 


口 工 可 。 了 后 口 入 。 号 后 工本 后 工 。 Webserver .port 1 73 
DOI.neod] .3erver.webserver.https.port 7483 
DIT. neod] .Server.database.mode | HA 


5) 在 每 一 侣 计算 机 的 根 目录 内 ， 找 到 conf/neo4j.properties 文 件 并 确保 以 下 的 属性 设 


a TE 
ee 127.0.0.1:6003 
online backup Sserve 127.0.0.1:6322 127.0.0.1:6323 
ha -cluster server 127.0.0.1:5003 
ha.initial hosts 127.0.0.1:5003 


2. 局 动 与 验证 


按照 以 下 步骤 局 动 与 验证 你 设置 的 服务 器 。 
1) 在 每 一 个 目录 中 友 出 如 下 局 动 命令 局 动 服务 器 : 


~/ndia/clusterexample/machine0l)})s bin/neod4i start 
~/n4ia/clusterexample/machine02)s bln/neod4] start 
~/n4ia/clusterexample/mchine03)s bin/neod4] start 


2) 对 每 一 个 服务 器 用 浏览 器 访问 网 页 管理 控制 全 〈 见 附录 A) 一 次 ， 需 要 一 定 的 时 间 启 动 以 验证 服务 器 正确 局 动 并 探测 它 
提供 的 详细 情 ) 


http:// /127.0., 
http://127.0. 
httpi//127.0. 


:T4711/webadmin/#/info/org.neo4j/High%20Availability/ 
:TA472/Wwebadmin/#/info/org.neod4ij/High®%20Availability/ 
:T7473/webadmin/#/info/org.neod4i1/High%20Availability/ 


CL Cy 


上 D 和 
| | | 


图 11-6 和 图 11-7 给 出 了 machine01 和 machine02 的 网 页 管理 页 面 。 
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图 11-6 ”从 machine01 的 视角 看 到 的 HA 设置 网 页 管理 控制 台 的 视图 
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图 11-7 ”从 machine02 的 视角 看 到 的 HA 设置 网 页 管理 控制 台 的 视图 


在 这 种 特殊 的 启动 场景 中 ，machine01 ( 国 ) 首先 启动 ， 并 且 集 群 中 还 没有 其 他 计算 机 启动 ， 假 设 machine01 是 主机 ， 就 
像 你 在 图 11-6 中 看 到 的 〈 思 ) 。 如 果 machine03 已 经 首先 启动 ， 它 将 被 假设 为 主机 的 角色 。 


网 页 管理 控制 侣 提供 了 一 个 关于 HA 集群 的 众多 详细 设置 ， 包 括 集群 中 涉及 的 其 他 计算 机 。 这 些 信息 可 以 在 
InstanceslnCluster (图 ) 中 找到 。 这 里 显示 的 第 一 台 计算 机 实际 上 是 machine01， 但 是 在 页 面 的 下 面 (图 11-6 中 没 给 
出 ) ，machine02 和 machine03 也 应 该 作为 从 计算 机 列 出 来 ， 给 出 它们 已 经 局 动 并 且 成 功 地 加 入 了 这 个 群 。 


在 图 11-7 中 ， 你 可 以 看 到 machine02 (图 ) 在 machine01 启 动 后 加 入 了 这 个 集群 ， 并 已 经 参与 了 从 计算 机 的 角色 ( 国 ) 。 
你 现在 应 该 已 经 设置 好 集群 并 且 运 行 了 。 下 面 继续 讨论 一 些 HA 的 更 详细 的 特色 。 可 以 随意 实验 并 试图 做 一 些 事情 一 一 这 经 
常会 是 一 种 最 好 的 学 习 方 式 ! 


11.2.3 ”复制 一 一 读 和 瑟 的 策略 


与 一 般 的 所 有 写 请 求 都 通过 主机 而 读 请 求 通过 从 机 的 主 -从 复制 设置 不 同 ，Neo4j 能 够 处 理 来 自 于 集群 中 任何 实例 的 写 请 
求 。 同 样 ，Neo 锋 能够 处 理 来 自 于 任何 主机 、 从 机 任何 实例 的 读 请 求 。 


写 请 求 的 处 理 根据 直接 来 自 于 主机 还 是 通过 从 机 而 不 同 。 图 11-8 给 出 了 当 一 个 写 请 求 直接 发 送 到 主机 的 事件 的 处 理 流程 。 
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A2 当 在 间 隐 的 范围 内 对, 任何 的 新 事务 都 会 被 从 
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站 主机 本 六 有 的 等 待 的 事 竺 
以 机 局 域 应 用 事务 
图 11-8 ” 当 一 个 写 请 求 直接 发 送 到 主机 实例 的 事件 处 理 流 程 


任何 直接 由 主机 收 到 的 写 请 求 将 会 以 非常 相同 的 方式 作为 一 个 标准 的 非 HA 事 务 处 理 ; 数据 库 需 要 一 个 锁定 并 执行 一 个 局 部 
事务 。 唯 一 的 差别 是 在 主机 上 提交 以 后 ， 有 一 些 配置 属性 (ha.tx_push_factor 和 ha.tx_push_strategy) 额外 地 以 乐观 的 方式 把 
事务 推 入 到 n ( 黑 认 为 1) 个 从 机 。 至 于 乐观 的 方式 ， 是 指 主 机 尽 最 大 的 努力 确保 事物 传送 至 配置 的 从 机 中 去 ， 但 是 如 果 这 种 传 
送 不 成 功 ， 不 管 是 由 于 什么 原因 ， 主 机 上 的 原始 事务 仍 不 会 失败 。 


其 他 从 机 也 能 够 周期 性 地 从 主机 拉 入 做 最 新 的 更 新 。 这 是 通过 设置 ha.pull interval 属 性 为 适当 的 值 实现 的 ， 例 如 2s (每 2 
秒 ) 。 这 一 推拉 机 制 用 于 控制 Neo4j 在 集群 中 最 终 具 有 一 致 性 的 速度 。 


四 注意 


这 里 乐观 的 使 用 并 不 意味 着 与 传统 数据 库 乐 观 锁 概 念 相 同 ， 对 于 乐观 锁 ， 如 果 检 测 到 数据 库 的 冲突 状态 ， 整 个 事务 〈 包 括 主 


机 上 的 ) 将 会 回 深 。 


转 到 第 二 种 情况 ， 如 果 一 个 从 机 收 到 一 个 写 请 求 ， 事 件 的 不 同 顺序 将 会 友 生 ， 如 图 11-9 所 示 。 


Neo4j HA 实例 3 


Neo4j HA 实例 1 
i 时 | 


， | , 
[ 


Neodj HA 实例 2 
( 当前 的 主 ) 


客户 发 送 写 请 求 给 共 机 在 后 台 


ry EE. | i FE | re hn | 呵 了 i 
人 和 才 出 一 个 提 溯 图 ， 中 ha, a i nterval 证 雇 定 基 克 1 


人 22 色 时 间 具 机 拉 入 更 新 1 时 区 古 不 定期 反 入 更 新， 


a i = | 下 上 a 
2 EE 机 雪 指 奋 姥 得 a | 号 = 上 有 和 机 | 可 pia 


@ 从 机 数据 库 菠 得 锁 
号 三 | 梧 届 的 还 转 内 时 ， 性 何 的 新 事务 都 会 惰 愉 主机 
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假如 主机 的 提 迹 基 成 功 的 , 局 域内 机 对 
入 近 | 下 了 


图 11-9 ” 当 一 个 写 请 求 发 送 到 从 机 实例 的 事件 处 理 流程 


所 癌 从 机 的 写 入 依赖 于 可 用 的 主机 以 便 更 新 的 实现 。 这 是 因为 从 机 在 继续 执行 前 将 会 同时 需要 在 主机 和 从 机 获得 锁 。Neo4j 
具有 可 靠 的 、 内 置 的 逻辑 目 动 探测 什么 时 间 什么 原因 使 实例 (包括 主机 ) 潜在 消失 或 不 能 访问 。 在 这 样 的 情况 下 ， 一 个 新 的 主机 
会 补 选 出 ， 并 且 如 果 需 要 ， 尽 可 能 多 的 达到 | 数据 最 新 。 如 果 无 汉 选 出 一 个 新 的 主机 ， 不 省 什么 原因 ， 这 会 在 本 质 上 停止 所 有 对 数 
据 库 的 更 新 。 


更 新 总 是 首先 应 用 于 主机 ， 并 且 仅 仅 当 主机 更 新 成 功 后 ， 更 新 才 应 用 于 从 机 。 要 确保 全 部 的 一 致 性 ，Neo4j 需 要 从 机 在 执行 
任何 写 操作 前 保持 最 新 的 数据 ， 因 此 ， 作 为 内 部 交流 协议 的 一 部 分 ，Neo4 将 会 确保 从 机 在 执行 任何 局 域 写 操作 之 前 将 所 有 的 最 
新 更 新 应 用 到 目 身 。 

监视 集群 中 更 新 的 传送 


为 了 观察 集群 中 推拉 更 新 的 发 生 ， 可 以 使 用 不 同 的 Neo4j HA 设置 ， 然 后 结合 使 用 Neo4j 网 页 管理 控制 台 ， 创 建 节点 和 关系 ， 
并 且 监 视 它 们 在 集群 中 的 复制 。 


1) 确保 所 有 服务 器 启动 并 且 如 11.2.2 节 中 描述 的 那样 运行 。 

2) 验证 每 一 个 服务 器 没有 要 开始 的 节点 。 这 可 以 通过 控制 人 台 选 项 卡 发 出 以 下 的 Cyphet 查 询 ( 它 应 该 返回 几 行 0) 实现 : 

start n=nodel*) return n: 

3) 在 主 服 务 器 上 (在 这 一 实例 中 是 machine01) 使 用 网 页 管理 控制 台 使 用 以 下 Cyphet 声 明 创 建 两 个 节点 和 一 个 关系 : 

CREATE (nl1l})-=[:LOVES|]=» (nz2).: 

4) 等 到 拉 的 时 间 间 隔 通 过 (默认 是 10 秒 ， 参 见 neo4j.propetties 文 件 中 的 ha.pull_interval 设 置 ) ， 然 后 通过 在 每 一 服务 器 上 再 次 
运行 步骤 2 中 的 查询 ， 验 证 这 些 值 也 存在 于 从 机 的 实例 中 。 现 在 你 应 该 看 到 在 每 一 个 服务 器 上 列 出 两 个 节点 。 

这 就 是 实战 中 Neo4j 的 数据 传送 机 制 。 

通过 从 机 写 入 或 不 通过 从 机 写 入 ， 这 是 一 个 问题 ! 

能 够 上 友 运 写 请 求 到 主机 或 到 一 个 或 多 个 从 机 给 部 署 选 项 提供 了 很 大 的 灵活 性 ， 但 是 ， 如 何 选 择 需 要 慎重 考虑 。 


- 通过 一 个 从 机 写 入 要 比 通过 一 个 专门 的 主机 写 入 慢 得 多 。 当 通过 从 机 写 入 时 ， 由 于 主机 和 从 机 的 同步 和 数据 活动 的 协调 需 


求 的 额外 网 络 流量 ， 将 会 有 一 个 很 高 的 延迟 。 


: 通过 一 个 从 机 写 入 能 够 增加 持久 性 ， 不 过 这 也 能 够 通过 配置 主机 一 旦 提交 项 复制 变化 实现 。 通 过 一 个 从 机 写 入 ， 可 以 确保 
至 少 有 两 个 Neo4j 实例 保 持 最 新 的 数据 (从 机 本 身 ， 以 及 主机 ) 。 男 外 ， 或 者 除 这 个 之 外 ， 能 够 通过 配置 一 旦 提交 ， 写 入 到 
主机 后 复制 出 到 指定 的 几 个 从 机 增加 持久 性 。 尽 管 这 会 发 生 在 一 个 最 优 基础 上 的 (通过 ha.tx_push_factor 属 性 ) ， 最 后 的 结果 是 你 
的 数据 将 会 到 你 配置 数量 的 电脑 上 。 分 布 的 持久 性 是 重要 的 ， 由 于 这 提供 了 更 大 程度 上 的 自信 ， 你 的 数据 完整 的 保存 到 了 多 个 地 
方 , 但 是 这 也 付出 了 代价 。 


总 是 至 少 


2 
DIN 
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需要 某 些 种 类 的 局 域 平衡 器 来 保证 写 仪 仅 的 、 或 主要 的 由 主机 处 理 。Neo4 没 有 提供 内 置 的 加 载 平 衡 功 能 ， 而 是 依赖 一 个 
外 部 的 某 些 种 类 的 机 制 来 提供 这 种 功能 。 对 客户 端 需求 的 这 种 功能 ，HAProxy (www.haproxy.org) 是 一 个 流行 的 选择 。 什 么 时 间 
从 从 机 路 由 到 主机 的 有 关 逻 辑 需 要 内 置 的 加 载 平衡 机 制 ， 这 可 能 是 一 个 棘手 的 问题 。 怎 样 才 能 知道 什么 是 一 个 读 请 求 或 写 请 求 ? 
基于 纯 流 量 通常 没有 100% 的 准确 方法 来 确定 这 个 。 这 常常 导致 这 样 的 情况 ， 要 求 应 用 程序 本 身 具 有 一 些 判 断 它 的 动作 是 读 还 是 


写 的 知识 ， 以 帮助 对 请 求 的 合适 路 由 。 


你 是 通过 主机 还 是 从 机 写 入 不 必 全 有 或 者 全 无 决策 。 如 果 你 的 系统 合理 的 话 ， 也 可 以 使 用 一 个 混合 的 方法 (大 多 数 情 况 是 写 
入 主机 ， 读 目 从 机 ) 。 要 按 实 际 情况 做 这 种 决策 。 现 在 提供 给 大 多 数 客户 的 一 般 推 荐 是 确保 写 入 主要 友 送 到 主机 ， 人 在 可 能 的 情况 
下 ,， 才 使 用 ha.tx_push_* 设 置 把 数据 推送 至 从 机 。 这 趋向 于 根据 灵活 性 和 性 能 提供 最 好 的 权衡 。 


11.2.4 ”缓存 分 区 


有 一 些 这 样 的 实例 ， 图 形 数据 库 太 大 以 至 于 不 能 放 入 可 用 的 内 存 中 。 现 在 的 建议 总 是 瞄准 一 个 理想 情况 ， 但 是 ， 如 果 就 是 不 
可 能 放 入 怎么 办 ? 


在 这 种 情况 下 ， 推 荐 考虑 使 用 一 种 称 为 缓 仔 分 区 的 技术 。 缓 仔 分 区 并 不 是 传统 的 分 区 。 


传统 的 分 区 〈 像 其 他 数据 存储 采用 的 分 区 ， 如 MongoDB) 通常 涉及 保证 数据 不 同 的 部 分 存 到 不 同 的 实例 ， 常 常 是 不 同 的 物 


理 服务 器 。 如 果 你 有 一 个 大 型 的 客户 数据 库 ， 可 以 选择 按 客户 组 分 区 。 例 如 ， 所 有 县 有 用 户 名 A 至 D 的 用 户 存 到 一 个 实例 中 ，E 至 
F 在 另 一 个 实例 中 ， 其 他 的 再 细 分 并 存 到 其 他 区 中 。 应 用 程序 应 该 需要 知道 哪 一 个 实例 具有 被 查找 的 数据 并 确保 到 正确 的 实例 中 
去 得 代数 据 。 当 然 ， 许 多 激活 分 区 的 数据 库 提供 目 动 的 分 区 和 访问 合适 的 实例 的 万 式 ， 但 是 这 里 的 重点 是 并 不 是 所 有 的 数据 都 他 
在 每 一 个 实例 或 服务 器 ， 而 只 是 一 个 数据 的 子 集 存在 每 一 个 实例 或 服务 器 中 。 


对 于 Neo4， 每 一 个 HA 实例 期 竺 具有 所 有 数据 集 的 访问 。 缓 存 分 区 ， 不 像 传统 分 区 ， 这 是 一 种 物理 数据 分 区 技术 ， 是 一 种 
更 像 基 于 路 由 的 模式 。 使 用 这 种 模式 ， 作 为 一 个 集合 日 位 通常 访问 的 数据 请 求 忌 是 指向 同一 个 Neo 和 4 实例。 通过 一 致 性 的 路 由 这 
些 请 求 到 同一 个 实例 ， 你 增加 了 这 些 数据 在 访问 时 被 放 到 内 存 中 的 可 能 性 ， 从 而 允许 这 一 实例 使 用 Neo 和 为 这 种 情况 提供 的 内 存 
访问 性 能 。 

让 我 们 再 一 次 看 看 前 面 的 客户 数据 库 例 子 。 对 于 Neo4j， 所 有 的 数据 (从 A 至 Z 的 客 尸 ) 出 现在 每 一 个 HA 实例 ， 但 是 通过 使 


用 某 些 种 类 的 加 载 平 衡 机 制 ， 你 能 够 确保 所 有 与 一 组 客户 〈 具 有 用 户 名 A 的 客户 ) 相关 的 局 域 请 求 将 总 是 路 由 到 同一 个 HA 实 
例 ，“B” 到 另 一 个 ， 依 此 类 推 。 图 11-10 给 出 了 缓存 分 区 对 这 种 图 形 数据 库 的 可 能 工作 方式 。 


间 载 平 商 闪 
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图 11-10 ”缓存 分 区 
为 什么 Neo4j 不 做 传统 的 分 区 


简单 地 说 ， 对 图 形 数据 库 这 是 一 个 非常 非常 难以 解决 的 问题 。 事 实 上 ， 如 此 的 难 是 这 个 问题 属于 一 类 “确实 很 难 的 数学 问 
题 ”: “ 非 确定 性 多 项 式 时 间 难 题 。 (http://en.wikipedia.org/wiki/NP-hard) 。 


传统 的 分 区 一 般 涉 及 分 裂 一 个 整 的 数据 集 使 得 不 同 的 部 分 存 到 不 同 的 实例 中 。 假 设 某 些 条 件 为 真 ， 这 种 方式 是 一 种 扩展 大 型 
数据 库 的 方法 ， 而 同时 随 着 数据 的 增长 保持 一 个 可 预测 的 性 能 水 平 。 


前 面 叙 述 的 关键 点 是 “ 假 ; 条 件 为 真 。 在 大 多 数 的 激活 分 区 的 数据 库 中 ， 关 键 是 哪些 数据 在 分 区 中 是 稳定 和 可 预测 


的 。 另 外 ， 通 第 使 用 这 样 的 访问 模式 ， 你 可 以 在 一 个 分 区 中 查找 你 需要 的 数据 〈 用 一 个 关键 字 ) ， 也 可 以 在 另 一 个 分 区 中 查找 ， 
然后 使 应 用 程序 在 需要 的 时 候 将 它们 一 起 返回 。 


然而 ， 图 形 数 据 库 ， 尤 其 是 Neo4j 的 最 大 优点 在 于 局 域 的 图 形 查 询 ， 即 从 给 定 的 点 开始 并 探索 与 它 紧 挨 着 周围 的 数据 的 连接 
模式 。 这 可 能 涉及 遍历 非常 不 同 的 数据 类 型 ， 这 些 数据 类 型 会 分 布 到 不 同 的 分 区 。 假 设 你 有 一 个 这 样 的 查询 “对 于 顾客 A， 告诉 
我 哪 一 个 商店 离 她 住 的 地 方 在 Ikm 以 内 ， 并 且 她 的 直接 朋友 在 上 一 个 月 中 在 那个 商店 购物 超过 100 英 镑 ”。 如 果 你 决定 分 区 数据 
使 用 户 和 朋友 存 到 一 个 分 区 ， 零 售 商店 在 另 一 个 单独 的 分 区 ， 购 买 历史 在 另 一 个 分 区 ， 随 着 数据 分 散 到 不 同 的 物理 服务 器 ， 一 个 
内 置 的 图 形 查 询 将 会 结束 ， 由 于 网 络 的 交 又 得 到 导航 ， 会 导致 不 可 预测 的 和 慢 的 数据 检索 时 间 。 


你 可 能 认为 可 以 尝试 基于 我 们 描述 的 模式 分 区 数据 ， 这 可 能 行 也 可 能 不 行 。 然 而 ， 这 可 能 潜在 的 否定 你 想 要 执行 的 其 他 遍历 
一 一 在 更 广 的 数据 集 上 从 其 他 节点 开始 ， 而 不 是 特定 顾客 A， 并 且 从 那里 开始 探索 。 


直到 我 们 能 够 穿越 网 络 边界 以 一 种 可 接受 和 可 预测 的 方式 执行 如 此 的 遍历 时 ， 在 此 期 间 涉 及 Neo4j 的 这 种 情况 的 最 好 解决 方 


案 是 使 用 缓存 分 区 。Neo4j 的 分 区 仍然 是 一 个 正在 探讨 的 问题 ， 但 是 在 近期 还 没有 迹象 显示 能 够 解决 这 个 问题 。 
路 由 策略 


正如 在 11.2.3 节 中 学 到 的 ， 束 客户 端 而 言 ，HA 设 置 中 没有 建立 路 由 和 加 载 平衡 功能 ; Neo 期 待 客 己 用 像 
HAProxy (www.haproxy.org) 的 工具 提供 或 实施 他 们 上 自己 的 路 由 和 加 载 平 衡 功 能 ， 使 用 HAProxy 是 一 个 流行 的 选择 。 和 忽略 物 
理 机 制 的 使 用 ， 每 一 个 应 用 程序 会 决定 数据 路 由 的 最 合适 策略 。 


这 些 选 项 包括 : 
基于 一 些 数 据 特性 的 路 由 请 求 ” 这 是 在 我 们 的 客户 例子 中 使 用 的 方法 。 


: 使 用 粘性 会 话 ”这 涉及 确保 来 自 于 每 一 个 客户 端的 请 求 总 会 到 同一 个 服务 器 ， 不 管 请 求 什 么 。 这 可 能 合适 也 可 能 不 合适 ， 
取决 于 不 同 的 情况 。 


使 用 基于 地 理 的 路 由 ”这 涉及 确保 所 有 与 一 个 共同 的 地 理 位 置 相关 或 起 源 的 请 求 总 是 路 由 到 同一 个 实例 。 
11.2.5 ”HA 人 小结 

由 于 本 书 讨 论 了 许多 主题 ， 我 们 仅仅 能够 肖 兰 实际 可 用 的 很 小 一 部 分 ，HA 也 不 例外 。 对 于 一 般 的 HA， 参 见 Neo4j 手 册 (第 
23 章 ) 的 “高 可 用 性 ”: http://docs.neo4j.org/chunkedy/stable/ha.html。 


现在 你 已 经 学 习 了 如 何 扩展 和 确保 Neo 能 够 继续 操作 并 为 客 尸 端 服务 ， 即 使 在 硬件 失效 时 。 现 在 我 们 将 移 到 本 章 的 最 后 一 
节 ， 涉 及 数据 的 备份 和 当 灾 难 确实 友 生 时 数据 库 的 恢复 。 


[1] CAP，Consistency 指 数据 的 一 致 性 ，Availability 是 确保 请 求 收 到 成 功 或 失败 的 响应 、Partition toletance 指 由 于 网 络 的 故障 系统 继 
译 者 注 


2] Erc Brewer，《CAP 十 二 年 后 : “规则 ”是 如 何 变化 的 》，www.infog.com/atticles/captwelve-years-latetr-how-the-rules-have- 


续 运 行 。 


11.3 备份 


你 的 社交 网 站 一 直 运 行 得 很 好 ， 为 你 市 来 了 很 大 的 收入 和 声誉 。 然 而 ， 突 然 你 的 管理 员 通 知 你 有 一 个 硬件 损坏 ， 当 前 的 数据 
去 大 。 


在 这 时 ， 你 的 心脏 要 么 咯 哈 一 下 并 且 你 会 说 ，“ 我 真 的 应 该 想到 把 数据 备份 起 来 啊 ”， 或 者 你 会 坐 下 并 且 想 ，“ 不 必 担 心 ， 


我 已 经 备份 了 ”。 


假设 你 选择 了 后 一 种 ， 本 蔬 的 目的 是 提供 所 有 必需 的 信息 以 确保 如 果 当 这 种 灾难 确实 友 生 时 ， 你 已 经 有 了 准备 ， 这 并 不 意味 
者 是 世界 的 末日 。 


我 们 将 通过 查看 做 一 个 简单 的 离线 备份 所 涉及 的 内 容 开 始 ， 一 个 涉及 停机 时 间 的 流程 ， 但 是 在 任何 版 本 的 Neo4j 数 据 库 都 能 
执行 的 沅 程 ， 包 括 免费 的 社区 版 。 对 于 那些 你 无 法 经 受 得 起 离线 的 情况 ， 在 线 备份 功能 融会 友 挥 作用 ， 但 是 ， 这 只 在 Neo4j 的 企 
业 版 可 用 。 

11.3.1 离线 备份 


在 一 天 结束 时 ， 包 含 Neo4j 数 据 库 的 文件 都 在 文件 系统 的 一 个 目录 中 ， 这 是 最 终 需 要 备份 的 文件 。 融 像 在 本 万 的 介绍 中 叙述 
的 ， 这 一 流程 将 在 所 有 Neo4j 数 据 库 的 版 本 中 都 有 效 ， 但 是 最 可 能 仅 应 用 于 社区 版 (如果 你 是 用 的 企业 版 ， 你 很 可 能 会 使 用 在 线 
备份 功能 ) 。 


流程 的 本 身 相当 简单 ， 涉 及 以 下 步骤 
1) 关闭 Neo4j 实 例 。 

2) 复制 实际 的 Neo4 和 激 据 库 文件 到 一 个 备份 的 位 置 。 
3) 重新 开始 Neo4j 实 例 。 

让 我 们 依次 看 看 这 些 步 又 : 

1. 关 闭 Neo4j 实 例 


如 果 运 行 单 一 的 服务 器 模式 ， 你 只 需要 用 stop 人 参数 执行 neo4j 脚 本 。 假 设 Neo4j 是 安 疼 在 /opt/neo4j/bin 中 ， 你 可 以 通过 友 
出 以 下 命令 停止 服务 器 的 运行 : 


a 


/opt/neo4j/bin/neo4j stop 


如 果 你 在 应 用 程序 中 运行 的 是 认 入 陈 模 式 ， 那 么 除非 你 是 显 式 提供 了 一 个 只 关闭 Neo4j 数 据 库 的 机 制 ， 你 应 该 用 你 选择 的 任 
何 机 制 关 闭 你 的 应 用 程序 。 这 惑 像 上 友 送 一 个 SIGINT 信 号 (例如 ， 如 果 你 的 应 用 程序 是 以 这 种 方式 开始 的 ， 在 一 个 终端 窗口 友 出 
Ctrl-C) 一 样 简 单 ， 或 者 可 能 更 复杂 一 些 ， 涉 及 一 个 专用 的 脚本 语言 或 目 定 义 的 应 用 程序 功能 。 


不 管 什么 机 制 ， 当 这 一 流程 友 生 时 ， 你 应 该 确保 Neo 笑 也 关闭 。 在 第 10 章 的 程序 10-3 中 你 会 看 到 当 以 肉 入 式 模式 运行 时 ， 
需要 什么 确保 这 一 情况 的 友 生 。 要 刷新 你 的 内 存 ， 这 里 是 注册 一 个 天 机 点 的 代码 片段 : 


private String DB PATH = '/var/data/neod4]db-private'.; 
private GraphDatabaseService graphdb = 

new GrapnDatabaseFactoryl) .newbhmbeddedDatabasel DB PATH |); 
registerSshutdownHook( graphDb ) ; 


private static void reglsterShutdownHook ( 
final GraphDatabaseService graphDb ) 


Runtime.getRuntime() .addshutdownHook!( new Thread'() 


Override 


Public void runl) 


i 


l 


graphDb .shutdown().; 


下 


当 你 的 应 用 程序 退出 后 确保 Neo4j 完 全 的 天 闭 是 很 重要 的 ; 没有 这 样 做 将 导致 下 一 次 局 动 时 出 现 问题 。 当 使 用 Neo4j 服 务 器 
模式 时 ， 你 不 必 担 心 是 否 是 完全 的 天 闭 一 服务 器 模式 将 会 为 你 做 好 。 


2. 复 制 物理 数据 库 文 件 


定位 包含 Neo4j 物 理 数据 库 文 件 的 目录 。 对 于 运行 具 入 陈 模式 的 应 用 程序 ， 这 将 是 你 提供 局 动 代码 的 路 径 。 要 刷新 你 的 内 
仓 ， 以 下 的 程序 片段 给 出 了 启动 柑 入 式 模 式 数 据 库 需 要 的 代码 ， 这 里 的 物理 文件 存在 /var/data/neo4jdb 目 录 中 : 


private GraphDatabaseService graphdb = 
new GraphDatabaserFactoryl) .newEmbeddedDatabase("/var/data/neo4jdb" ) 


如 果 你 是 以 服务 器 模式 工作 的 ， 数 据 库 文件 将 会 位 于 neo4jserver.properties 文 件 中 以 org.neo4j.server.database.location 
关键 字 指 定 的 位 置 。 这 一 设置 将 会 有 一 点 像 以 下 的 样子 : 


Org .neod4]j .server.database.location=/var/data,/neo4jdb 

复制 这 一 目录 和 所 有 的 子 文件 夹 及 其 所 有 的 文件 到 一 个 分 离 的 备份 位 置 。 

3. 重 新 启动 数据 库 

对 于 Neo4D 服 务 器 模式 ， 使 用 适当 的 Neo4D 局 动 命 令 ， 并 且 对 家 入 式 应 用 程序 ， 在 合适 的 时 | 间 局 动 应 用 程序 。 
曲 注 半 


Neo4j 能 够 检测 非 完全 的 关闭 并 且 试 图 恢复 ,但 是 这 将 导致 恢复 过 程 时 更 慢 的 启动 ， 并 且 有 时 也 会 导致 其 他 的 一 些 问题 。 当 
一 个 非 完全 的 关闭 发 生 后 ， 以 下 的 警告 信息 通常 会 在 下 一 次 数据 库 重新 启动 时 在 日 志 中 看 到 
目 


应 该 确认 你 的 关闭 流程 ， 不 管 是 强制 的 还 是 


non clean shutdown detected。 你 


11.3.2 在 线 备 份 


在 绪 备 份 功能 仅 在 Neo 用 的 企业 版 中 可 用 ， 但 是 这 是 一 个 强大 和 可 靠 的 备份 你 的 单机 或 集群 Neo 浊 环境 而 不 需要 任何 停机 的 
廊 趟 。 


对 和 在线 备份 你 有 两 个 选项 : 完全 备份 或 增 量 备份 。 在 两 种 情况 下 ， 对 正在 备份 的 Neo4j 实 例 资源 不 需要 锁定 ， 人 允许 它们 在 备 
份 进行 中 继续 友 挥 其 功能 。 


1. 完 全 备份 


一 个 完全 备份 实质 上 涉及 复制 所 有 的 核心 数据 库 文件 到 一 个 分 离 的 备份 目录 。 由 于 正在 备份 的 数据 库 并 没有 锁定 ， 很 可 能 当 
备份 开始 后 ， 一 个 事务 正在 运行 。 为 了 确保 最 后 的 备份 保持 一 致 性 并 数据 最 新 ，Neo4j 将 会 确保 这 一 事务 和 任何 其 他 的 在 复制 期 
间 扩 生 的 ， 复 制 到 最 后 的 备份 文件 中 。Neo4j 通 过 记录 当 备 份 开始 后 任何 进程 中 的 事务 编号 实现 上 述 目 标 。 当 复制 核心 文件 结束 
后 ， 然 后 备份 工具 会 使 用 事务 日 志 (在 11.1.5 节 中 讲 过 ) 重新 做 从 记录 的 事务 和 包括 的 在 复制 期 间 友 生 的 所 有 事务 。 在 这 一 过 程 
的 最 后 ， 你 将 会 有 一 个 完全 的 备份 和 一 致 性 的 Neo4j 实 例 。 


2. 增 量 备份 


与 完全 省 份 不 同 ， 增 量 备份 不 复制 所 有 的 核心 存储 文件 作为 备份 过 程 的 一 部 分 。 相 反 ， 它 假设 至 少 已 经 做 过 一 次 完全 备份 ， 
这 次 备份 作为 最 初 开 始 的 点 识别 接 下 来 友 生 的 任何 变化 。 第 一 次 增 量 备份 过 程 将 仅 通 过 从 最 初 的 完全 备份 友 生 的 事务 日 志 复 制 ， 
因此 使 备份 数据 存储 到 一 个 新 的 上 次 标记 的 备份 各 。 这 一 点 是 标记 的 ， 并 且 下 一 次 增 量 备份 将 会 使 用 这 一 点 作为 新 的 备份 起 始 
点 ， 仅 通过 从 最 近 一 次 增 量 备份 点 到 当前 的 点 友 生 的 事务 日 志 复 制 。 这 些 日 志 企 备份 存储 中 被 重 新 执行 ， 使 其 成 为 最 近 一 次 的 标 
记 备 份 点 。 在 此 后 的 每 次 增 量 备份 请 求 中 都 重复 这 一 过 程 。 增 量 备份 是 一 个 更 局 效 的 备份 过 程 ， 由 于 它 尽 可 能 地 最 小 化 了 通过 续 
路 传送 的 数据 量 以 及 实际 做 备份 所 花费 的 时 间 。 


3. 做 备份 的 过 程 
无 论 是 完全 备份 还 是 增 量 备份 ， 激 活 和 备份 的 过 程 是 相同 的 。 图 11-11 给 出 了 一 个 单个 服务 器 设置 的 备份 场景 的 例子 。 


每 当 你 的 Neo4j 实 例 开 始 时 (嵌入 式 或 服务 器 模式 ， 单 个 或 HA) ， 它 们 检查 看 它们 的 online_backup_enabled 配 置 参数 是 
否 设置 为 true。 如 果 是 true， 一 个 分 离 的 备份 服务 (来 自 于 Neo4j 发 布 时 的 一 部 分 ) 也 就 开始 了 。 默 认 的 端口 对 单一 服务 器 模式 
设置 是 6362， 对 HA 设置 是 2001。 这 一 服务 为 Neo4j 备 份 工具 的 连接 提供 了 访问 点 ， 以 读 取 底 层 的 存储 和 事务 日 志文 件 做 备份 。 


Neo4j 备 份 工具 仅仅 是 一 个 能 理解 如 何 连 接 一 个 或 多 个 Neo4j 备 份 服务 的 面 回 Java 应 用 的 UNIX 或 Windows 脚 本 语言 (可 以 
在 bin 文 件 夹 中 找到 ) 。 备 份 工 具 可 以 从 网 络 上 的 任何 计算 机 上 运行 ， 前 提 是 这 侣 计算 机 具有 连接 到 备份 服务 的 能 力 。 UNIX 系 统 
的 备份 命令 具有 以 下 的 格式 : 


. /e041 -backup -from <SOuUrce-uris -to <backup-dirs 


服务 器 (193.168.1.30) 服务 器 (192.168.2.40) 


Neo4j 备份 服务 Neo4j 首 份 工具 
(6362) 


Neo4j 服务 器 (7474 
陪 入 式 Neo4j 应 用 人 


:mnt/backupineo4]-backup 


. | xx 存储 文件 ”地 辑 日 志 \ @ 


单一 服务 器 的 Neo4j 备份 工具 用 


当 Neodj 局 动 时 , 如 果 配 置 参 数 online 
Unix 命令 行 再 用 的 例子 : 


backup enabled=truel 从 Neo4j 1.9 下 

开始 默认 的 =tme) 开 启 , Neo4j 备份 服务 人 

{ 办 认 端口 是 362 ) 也 会 开始 192 .168.1.30 -to /mnt/backup/ 
neod]j]-backup 


Neo4j 首 份 工 具 检查 目标 普 份 日 录 以 确定 是 做 
完全 和 和音 份 还 是 做 增 嚼 阁 份 ( 如 来 目录 时 宇 的 束 
做 完全 备份 ,如 果 前 面 的 备份 已 在 日 录 中 在 在 


就 做 增 量 备份 ) 


图 11-11 单一 服务 器 设置 的 备份 场景 例子 


对 Windows 系 统 是 这 样 的 格式 : 


neoa]-backup -from <SoOurce-uri> -to <backup-dir> 


参数 如 下 : 


` backup-dif 备份 存储 的 目录 。 为 了 做 完全 备份 ， 这 个 目录 必须 是 空 的 。 如 果 备 份 工具 检测 到 一 个 早期 版 本 的 数据 库 在 那 


里 ， 它 将 试图 做 增 量 备份 。 
soutce-ufi 这 给 备份 工具 提供 了 需要 连接 到 适当 的 备份 服务 的 所 有 信息 ， 并 且 需 要 以 下 面 的 格式 指定 (详细 情况 来 自 于 人 
们 的 文档 ， 可 以 在 这 里 找到 : https://github.com/neo4j/neo4j/blob/2.0-maint/enterptise/backup/stc/docs/man/neo4j- 


backup.1.asciidoc) 。 
<running-mode>://<hosts>[:port]{,<host>[:port]*)} 


running-mode: 
‘single' or 'ha'; ha'’ 
Availability mode, ‘single' 


is for instances in High 
is for standalone databases. 


host: 
In single mode, the host of a source database; in ha mode, 
the cluster address of a cluster member. Note that mltiple 
hosts can be given when using High Avallablility mode. 


Port: 
In single mode, the port of a source database backup service; 
in ha mode, the port of a cluster instance. If not given, the 
default value 6362 will be Used for single mode, S001 for HA 


如 何 安排 备份 ? 


Neo4j 本 身 不 提供 任何 日 程 功能 。 它 期 待 你 会 使 用 一 个 外 部 的 日 程 工具 (如 cton) 来 做 这 项 工作 。 使 用 像 cron 类 的 东西 ， 你 可 


以 设置 每 小 时 做 一 次 增 量 备份 ， 或 者 任何 适合 你 的 频次 。 


11.3.3 ”从 备份 中 还 原 数 据 


从 备份 中 还 原 Neo4j 数 据 库 ， 只 需要 按照 下 面 的 步骤 : 
1) 关闭 要 还 原 的 指定 Neo4j 实 例 。 
2) 删除 包含 旧 的 或 损坏 了 的 版 本 的 Neo4j 数 据 库 并 用 备份 版 本 的 数据 库 蔡 换 它 。 


3) 重新 局 动 Neo4j 实 例 。 


11.4 本 书 可 能 没有 肖 兰 但 你 可 能 会 天 注 的 问题 
安全 与 监控 是 两 个 我 们 没有 涉及 的 主题 ， 但 是 如 果 你 在 这 些 领域 具有 特殊 的 需要 的 话 ， 这 可 能 是 值得 研究 的 两 个 主题 。 
11.4.1 安全 


确保 能 在 生产 环境 中 安全 运行 Neo4j 应 该 是 你 的 配置 中 的 一 个 重要 组 成 部 分 。 取 决 于 你 是 人 否 正在 使 用 Neo4j， 有 一 些 不 同 的 
方面 需要 考虑 。 


对 于 那些 使 用 众 入 式 模 式 的 用 户 来 说 ， 没 有 提供 随手 融 用 的 现成 安全 选项 ，Neo4j 没 有 提供 任何 数据 级 的 安全 或 加 密 措施 。 
大 多 数 随手 就 用 的 选项 (以 及 一 些 辅助 安全 配置 设置 和 万 法 ) 是 面向 使 用 单机 模式 Neo 和 (Neo4i 服 务 器 模式 ) 的 。 


官方 的 文档 提供 了 对 要 查找 的 东西 相对 较 好 的 涵 蓝 ， 以 及 一 些 如 何 开 始 保 护 你 的 Neo4g 系 统 的 基本 说 明 。 更 多 的 信息 可 以 看 
Neo4j 手 册 中 的 “对 Neo4j 服 务 器 的 安全 访问 ”一 节 : http://docs.neo4j.org/chunked/stable/security-server.html。 


11.4.2 ”监控 


能 够 监控 你 的 Neo 和 系统 的 运行 情况 并 能 知道 什么 时 间 会 遇 到 麻烦 是 一 种 确保 系统 稳定 和 长 时 间 运 行 的 好 的 方式 。 大 多 数 
Neo4j 监 控 特 性 仅仅 在 Neo 和 的 企业 版 才 有 ， 并 且 一 般 是 通过 Java 管 理 扩展 (JMX) 技术 实现 的 
(http://docs.oracle.com/javase/7/docs/technotes/guides/jmx/index.html) 。 


更 多 的 天 于 什么 是 可 用 的 和 如 何 获得 这 些 信息 的 内 容 ， 可 以 在 Neo 有 4 手册 的 第 26 章 找 
到 : http://docs.neo4j.org/chunkedy/stable/operations-monitoring.htm|。 


11.5 本章 小 结 


茶 喜 ! 你 已 经 到 达 了 本 书 Neo4j 旅 程 的 终点 。 在 这 最 后 的 一 章 ， 你 参与 了 一 个 通 往 高 水 平 Neo4j 结 构 的 旅程 ， 不 时 地 潜入 深 


处 ， 获 得 一 些 有 价值 的 深层 理解 和 一 些 Neo4j 内 部 的 为 什么 ， 特 别 是 在 配置 Neo4j 的 背景 下 在 一 个 生产 环境 中 最 优 运行 Neo4j。 


此 外 ， 你 获得 了 粗略 计算 系统 的 硬盘 和 内 存 需 求 量 的 洞 宗 内 部 参数 能 力 。 你 也 学 会 了 有 关 Neo4j 涉 及 文件 系统 缓存 和 对 象 缓 
存 的 两 层 缓存 策略 和 如 何 使 这 些 配 置 适 合 你 的 需要 。 


由 于 这 是 本 书 的 最 后 一 章 ， 我 们 回顾 了 一 些 在 本 书 的 前 面 几 章 中 遇 到 的 基本 概念 。 在 对 基本 的 Neo4j 结 构 有 一 个 坚实 的 理解 
基础 上 ， 你 的 最 后 任务 涉及 学 习 如 何 做 关键 的 配置 Neo4j 的 工作 ， 以 便 以 集群 的 高 可 用 性 设置 运行 Neo4j， 还 有 如 何 备份 和 恢复 数 
据 库 。 


11.6 最 后 的 设想 


尽管 本 章 标 志 着 本 书 的 结束 ， 但 是 我 们 希望 这 标志 着 你 的 Neo4j 生 涯 的 开始 。Neo4j 具 有 太 多 的 东西 ， 我 们 无 法 全 部 涵盖 。 我 
们 才 只 接触 了 一 点 皮毛 的 东西 。 我 们 确实 希望 我 们 已 经 提供 了 足够 的 基础 知识 和 参考 以 帮助 你 上 路 ， 以 便 开 始 探索 所 有 的 Neo4j 
功能 。 我 们 很 高 兴 编 写本 书 并 且 愿 意 与 你 共享 我 们 的 经 历 ， 我 们 愿意 听 到 你 以 新 的 和 有 趣 的 方式 使 用 Neo4j 的 经 历 。 


附录 A 安 委 Neo4j 服 务 器 


这 一 附录 中 的 详细 说 明 是 面向 从 压缩 文件 tar.gz (Mac/UNIX) 或 zip 文 件 (Windows) 安装 Neo4j 服 务 器 的 。 


Windows 用 户 足 够 幸运 地 成 为 二 进 制 安 妆 包 的 第 一 批 接收 者 ， 而 对 于 Mac/ 人 UNIX 用户， 二进制 安 妆 包 会 在 后 面 的 适当 时 候 
推出 。 如 果 你 愿意 使 用 二 进 制 的 Windows 安 闭 包 ， 请 按照 Neo4j 网 站 http://neo4j.org/download 上 的 说 明 进 行 。 


Neo4j 的 版 本 和 正式 文件 引用 


本 书 是 针对 Neo4j 2.0 的 ; 除非 在 特定 的 讨论 中 指定 不 同 的 版 本 ，Neo4j 2.0 是 所 有 的 代码 运行 和 验证 的 版 本 。 正 像 你 能 够 体会 
到 的 ， 在 产品 的 不 断 更 新 中 想 写 一 本 保持 最 新 版 本 的 书 具 有 很 大 的 挑战 性 。 假 如 没有 非常 大 的 变化 ， 你 应 该 能 够 替换 成 最 新 版 的 
Neo4j 2.0.1。 


为 确保 总 能 连接 到 最 新 的 信息 ， 我 们 一 直 在 努力 使 用 指向 最 新 稳定 版 本 的 官方 参考 文件 。 在 本 书写 作 时 ， 所 有 的 Neo4j 文 件 
URL 遵 循 一 个 共同 的 模式 ， 即 http://docs.neo4j.org/chunked/< 版 本 >， 这 里 的 版 本 是 你 希望 阅读 文件 的 Neo4j 版 本 ， 运 行 稳定 常常 
是 指 最 新 发 布 的 和 最 稳定 版 本 的 别名 


对 2.0.1 的 专门 信息 ， 请 参阅 http://docs.neo4j.org/chunked/2.0.1。 对 最 新 的 稳定 版 本 ， 请 参 


阅 http://docs.neo4j.org/chunked/stable。 


A.1 安 半 和 配置 单一 Neo4j 服 务 器 


按照 这 些 步骤 安装 和 配置 单一 Neo4j 服 务 器 : 


1) 确保 你 已 经 安装 了 最 新 的 Oracle 7 JDK， 如 果 没 有 ， 可 以 
在 www.oracle.comytechnetworkVjavaV/javase/downloadsjdk7-downloads-1880260.htmlI 下 载 并 安 半 。 


2) 定位 和 下 载 合 适 版 本 的 Neo4j 安 妆 文 件 (如 前 面 所 说 的 ， 本 书 的 所 有 实例 代码 都 是 在 2.0.1 版 本 里 运行 并 验证 的 ， 并 且 这 
里 的 所 有 说 明 是 针对 这 一 版 本 ， 随 蕊 尝试 使 用 最 新 的 版 本 ， 前 提 是 假设 没有 引进 重大 的 变化 ) 。 
从 http://neo4j.com/download/other-releases/ 选 择 适 合 Windows 或 Linux/Mac 的 文件 : 


— Linux/Mac: neo4j-community-2.0.1-unix.tatr.gz 
- Windows: neo4]j-community-2.0.1-windows.zip 


3) 解压 缩 文 件 到 你 的 硬盘 的 Neo4j 主 目录 位 置 (NEO4J HOME) ， 我 们 前 面 已 经 提 到 该 目录 。 例 如 ， 一 个 像 这 样 形式 的 
目录 : /users/xxxx/devstuff/neo4 和 -community-2.0.1。 


对 Linux/Mac， 使 用 以 下 命令 : 


上 ar ZXVLE neocd4j-community-2.0.1-unilix.tar.gz 


对 Windows， 使 用 一 款 合适 的 解压 缩 工 具 软件 ， 例 如 7-zip 或 winzip。 


4) 如 果 需 要 ， 修 改 控制 Neo4j 如 何 局 动 的 配置 文件 。Neo 甩 服务 器 允许 你 通过 位 于 conf 目 录 中 的 两 个 文件 配置 Neo4 工 作 
方式 的 许多 方面 。 


— conf/neo4j-servet.properties 
— conf/neo4j.propetties 


要 改变 核心 数据 库 文 件 的 位 置 (默认 是 在 data/graph.db 目 录 中 ) ， 如 下 更 新 neo4j-server.properties 文 件 的 


org.neo4j.server.database.location 属 性 。 


Org.nNneo4] .Server.database. location= 
/USers/xxxx /devestuff /neo4j]-in-action/code-samples/chapterl0y 
performance-demos-server/the-chapterl0-server-db 


关于 选项 的 更 多 内 容 ， 可 以 参考 Neo4j 手 册 的 第 22 章 : http://docs.neo4j.org/chunked/stable/server- 


configuration.htm|。 


5) 在 你 的 NEO4J_HOME 目 录 中 打开 一 个 终端 (Mac/Linux) 或 一 个 命令 提示 符 (Windows) ， 通 过 执行 具有 start 命 令 的 
neo4j 脚 本 语言 司 动 数 据 库 。 


— Linux/Mac: bin/nheo4j start 


— Windows: bin\neo4j.bat start 

6) 通过 访问 http://localhost: 7474 并 检查 Neo4j 浏 览 器 的 窗口 验证 数据 库 的 启动 (参阅 A.2 节 ) 。 
7) 要 天 闭 服务 器 ， 执 行 具 有 stop 命 令 的 neo4j 脚 本 : 

- Linux/Mac: bin/neo4j stop 

— Windows: bin\neo4]j.bat stop 


官方 的 安装 过 程 也 可 以 在 Neo4j 手 册 的 第 21 章 中 找到 : http://docs.neo4j.org/chunked/stable/serverinstallation.html。 


A.2 Neo4j 浏 顺 呈 


Neo4j 服 务 器 具有 一 个 集成 整洁 的 浏览 器 。 在 一 个 运行 的 服务 器 实例 上 访问 http://localhost: 7474/browser。 你 遇 到 的 第 
一 个 屏幕 将 会 是 一 个 启动 页 面 ， 如 图 A-1 所 示 。 
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图 A-1 Neo4 浏 览 器 启动 页 面 


你 可 以 单 击 Intro 按 钮 以 得 到 一 个 浏览 器 的 指导 教程 。 然 而 ， 它 的 核心 是 浏览 器 允许 你 运行 特定 的 查询 并 且 很 容易 地 以 表格 
或 图 形 的 方式 可 视 化 查询 的 结果 。 


如 果 你 单 击 页 面 左 边 的 Neo 笑 与 三 个 点 的 图 标 ， 你 将 会 得 到 侧 边 栏 给 出 一 个 系统 中 的 主 标 签 和 关系 的 原始 视图 。 你 可 以 从 这 
里 开始 导航 ， 或 者 在 页 面 的 项 部 输入 一 个 特定 的 Cypher 查 询 。 图 A-2 描 绘 了 第 10 章 的 一 些 样本 数据 库 可 用 的 选项 。 


单 击 节点 标签 下 面 的 星 号 (*) 执行 默认 的 Cypher 查 询 MATCH n RETURN n LIMIT 25， 这 会 让 你 可 视 化 图 形 数据 库 中 开 
始 的 25 个 节点 和 它们 的 关系 ， 如 图 A-3 所 示 。 


图 A-3 给 出 了 第 10 草 的 样本 演示 数据 的 前 25 个 节操 。 


= te | localheost?ar4/brmyseri 
Nesdl 2.0.1 


[| . 
pay Welconme 


-ar 全 | 
Ber | Ms db 


Feelationchip typos 各 Getting started Jump into code 


“is. rmenD or Ey laarnarg sboul 时 Be miih a rin granh apes... 
a | LF et 


Property Reys Bintre - a gulded tour BThe Movis Graph 
Concepts - GraphDe 101 
Cypher - guery language 
Di mi oh mes 
Licsrait sare esr ha toeLiFrenster Check out Thankshtcm, 3 universal recommenag svatern 


FE 车 一 


haplsrle.-sar eer- 


Copyright SH Neco Technology 200F=2014 


: ED HE 


图 A-2 ”有 具有 扩展 侧 边 栏 的 Neo4 和 浏览 器 启动 页 面 
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图 A-3 ”Neo4j 浏 览 器 中 系统 节点 的 图 形 可 视 化 


A.3 ”Neo4j 网 页 官 理 控制 谷 


Neo4j 从 2.0 往 后 具有 了 Neo4j 浏 览 器 ， 并 且 它 以 图 形 用 户 界面 (GUI) 继续 发 展 。Neo4 2.0 版 本 以 前 ， 用 户 需要 使 用 网 页 
管理 控制 台 。 网 页 管理 控制 台 仍 然 可 用 ， 对 于 那些 希望 访问 它 的 用 户 ， 可 以 从 http://localhost: 7474/webadmin 获 得 ， 图 A-4 
给 出 了 网 页 管理 控制 台 的 界面 。 
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图 A-4 Neo4j 网 页 管理 控制 台 


附录 B 设置 和 运行 示例 程序 


本 书 使 用 的 所 有 源 代码 都 可 以 在 www.manning.com/Neo4jinAction 以 及 https://github.com/opencredo/neo4j-in- 
action 下载。 


所 有 的 代码 和 演示 都 是 使 用 Java， 因 此 ， 你 需要 安 六 合适 版 本 的 Java。 另 外 ， 我 们 使 用 Maven 作 为 主要 的 框架 提供 代码 的 
目 动 建立 、 编 译 和 运行 。 


本 书 主要 及 用 基于 JUnit 测 试 来 演示 特性 ， 但 是 也 有 一 些 单机 版 本 的 类 (这 没有 作为 测试 包 的 一 部 分 参与 运行 ) ， 这 些 也 可 
以 执行 以 查看 它们 的 运行 结 


本 附录 给 出 了 设置 系统 运行 这 些 例 子 和 相关 源 代码 需要 的 说 明 。 
B.1 ”设置 你 的 环境 
本 节 摘 述 如 何 准备 你 的 电脑 运行 相关 的 例子 和 演示 代码 。 


1. 下 载 样本 代码 


下 载 和 解压 样本 代码 到 我 们 提 及 的 目录 ， 如 N4JIA SAMPLE_HOME。 源 代码 以 zip 格 式 提 供 ， 并 且 能 
从 www.manning.com/Neo4jinAction 下 载 。 另 外 ， 你 也 可 以 简单 在 在 https://github.com/opencredo/neo4j-in-action 复 制 
github 库 。 


2. 安 装 JDK (Oracle SE 7) 


Neo4j 需 要 Java 7 作为 最 低 要 求 的 JDK (Java Development Kit，Java 开 发 包 ) 运行 ， 并 且 已 经 针对 Java 7 做 过 测试 。 对 那 
些 想 尝 试 Java 8 的 用 户 ， 尽 管 在 理论 上 你 可 以 这 样 做 ， 但 在 现 阶段 还 不 能 确保 没有 问题 ， 因 此 我 们 还 是 推荐 你 现在 坚持 用 Java 


7， 直 到 官方 宣布 支持 Java 8 后 再 用 。Maven 也 是 基于 Java 的 工具 ， 并 且 需 要 安装 一 个 特定 的 JDK， 而 不 仅 是 一 个 JRE (Java 


Runtime Environment，Java 运 行 环 境 ) 。 


你 应 该 下 载 和 在 JAVA_HOME 目 录 安 装 最 新 的 Oracle JDK (在 本 书写 作 时 是 Java SE 7u60) 。 操 作 系统 特定 版 可 以 
在 www.oracle.comytechnetworkVjavaVjavase/downloadsindex.html 下 载 ， 安 装 说 明 可 以 


在 http://docs.oracle.com/javase/7/docs/webnotes/install/index.htmI 下 载 。 
记 住 
按照 JDK 安 装 说 明 操 作 ， 而 不 是 JRE 的 说 明 。 


3. 安 装 Maven (3.0.5+) 


Maven (http://maven.apache.org) 是 一 个 基于 Java 的 开 友 框 避 用 于 帮助 管理 代码 的 设置 、 创 建 、 编 译 和 依赖 解决 方案 
的 许多 方面 ， 包 括 测 试 的 运行 。 这 些 是 所 有 的 已 知 的 和 标准 的 流程 ， 被 称 为 Maven 生 命 周 期 ， 由 一 个 项 目 对 象 模型 文件 控制 ， 
也 称 为 pom.xml 文 件 。 


由 于 其 标准 的 结构 和 流程 ，Maven 的 优点 之 一 是 每 当 用 户 遇 到 一 个 新 的 Maven 项 目 时 ， 它 们 一 般 能 够 迅速 局 动 并 运行 。 所 
有 的 事情 将 会 按期 待 的 残 位， 并 且 会 用 通用 的 命令 创建 和 执行 代码 。 

使 用 Maven 的 另 一 个 好 处 是 它 的 依赖 管理 系统 。 你 只 需要 告诉 Maven 你 需要 什么 样 的 库 ， 它 融会 去 获取 这 些 库 (以 及 任何 
的 子 依赖 ) 不 需要 手动 下 载 。 这 意味 着 所 有 的 源 代码 将 会 建立 并 且 能 够 通过 Maven 的 运行 测试 。 


下 面 给 出 来 自 pom.xml 文 件 依赖 部 分 的 代码 片段 ， 演 示 如 何 指定 spring-data-neo4j 库 需要 的 版 本 号 3.1.1.RELEASE。 


<dependencies,s 
<ddependency»> 
<rouplId>org .springftramework ,data</groupld> 
<artifactId>spring-data-neo4j</artifactId> 
<VeErslon>3.1.1.RELEAMSE<VEIrSlLONS 


</dependency> 
</dependencies> 


可 以 在 http://maven.apache.org/download.cgi 找 到 合适 的 二 进 制 文 件 以 及 操作 系统 特定 版 的 安装 说 明 。 请 确保 你 使 用 的 
是 Maven 3.0.5 或 更 高 版 本 。Maven 网 站 拉 述 的 安 半 过程 将 会 帮助 你 建立 Maven 主 目录 (M2 HOME 目 录 ) ， 这 应 该 是 一 个 相 
对 简单 的 过 程 。 


然而 ， 如 果 是 在 受 限 制 的 环境 运行 (在 一 个 防火 墙 后 面 或 在 一 台 有 权限 限制 的 计算 机 上 ) ， 你 可 能 需要 多 做 一 点 配置 。 
Maven 网 站 的 “用 Maven 建 立项 目 ” 页 为 此 提供 了 更 详细 的 一 组 说 明 ， 包 括 它 在 受 限 的 情况 下 的 使 


用 : http://maven.apache.org/run-maven/index.html, 
B.2 ”运行 演示 和 样 例 
本 节 提 供 运 行 本 书 附带 的 样 例 和 演示 代码 的 专用 说 明 。 这 里 假设 你 已 经 按照 B.1 节 的 详细 安装 说 明 做 了 。 


1 一 般 襄 明 


这 里 的 说 明 是 为 从 命令 行 运行 样 例 的 ， 但 是 ， 你 可 以 同样 轻松 地 从 IDE (集成 开 上 友 环 境 ， 


提 条 件 是 有 合适 的 (Maven) 插件 可 用 并 且 已 做 了 基本 的 安 委 设置 : 


1) 如 果 你 没有 可 用 的 插件 ， 按 照 B.1 节 的 说 明 安 装 Java 和 Maven。 


2) 打开 一 个 命令 提示 符 (Windows) 或 终端 (UNIX) 窗口 。 


3) 改变 目录 到 N4JIA SAMPLE HOME 根 目录 。 


4) 输入 以 下 命令 ， 


这 将 会 建立 、 编 译 和 运行 本 书 中 详细 介绍 的 所 有 主 代 码 样 例 的 不 同 测试 。 


IE Clean linstall 


5) 你 将 会 在 终端 窗口 看 到 许多 输出 ; 如 果 一 切 都 成 功 的话 ， 在 最 后 你 会 看 到 类 似 如 下 的 输出 : 


LINFO] 
[INFO] 
[INFO] 
[INEFQ] 
[INFO] 
|INFO] 
[INFO] 


如 果 你 


install 命 令 。 另 


件 ) : 


mVn Clean lnstall 
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chapter0l 
chapterDd2 
chapterdna 
chapterod 


chapterds 


chapterde 
chapter07 -core 
chapter07-spring 

Be ee 
chapter09-current-simple 
chapter09-=-current-advanced 
chapter09-=-1legqacy=Bimple ci 
chaptero9-legqacy-advanced 
chapterl0-embedded 
chapterli0 -server 


a . . - 四 四 四 四 四 下 -= 四 四 时 上 - 中 四 四 - . 里 四 a 四 中 - 中 到 = 量 呈 审 让 四 


a 四 - . 加 四 四 四 时 四 中 s 四 a 四 . 让 


吕 蝇 昌 下 二 届 蝇 三 i i 中 


chapterl0-pertormance-demos- Server 
chapterl0-pertormance-demos-embedded 
chapterll-commnity-embedded 
chapterll-enterprise-embedded 


时 定 定 和 


下 和 La n 醒 恒 到 r La Li 


BUILD SUCCESS 


bp2 .638s 
Sat Juij] 0 
38M/305M 


Total time: 
Finished at: 
Final Memory: 


I 
By 
BI 


只 是 想 运 行 某 一 章 的 测试 ， 可 以 改变 目录 到 合适 的 草 (确保 这 一 目录 有 一 个 pom.xml 文 件 ) 并 且 再 次 运行 mvn clean 
另外 ， 你 也 可 以 在 N4JIA_SAMPLE_ HOME 目录 中 ， 使 用 以 下 命令 ( 蔡 换 合适 的 目录 ， 目 录 中 需要 有 pom.xml 文 


-££ chapter04 /pom. xml 


SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCES 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
SUCCESS 
久 上 CC 也 名 
SUCCESS 
SUCCESS 
SUCCESS 


如 Eclipse 或 Intellij) 运行 它们 ， 前 


.319g8] 
.4948] 
. SS6S] 
.B8738] 
;4508] 
.4208] 
. 290s] 
.T7048] 
.1238s] 
.815898] 
, 之 E638] 
.D0538] 
0 .2018] 
.S5358] 
.1228] 
, D428|] 
.B328] 


2. 第 10 章 的 说 明 

第 10 章 的 样 例 代码 包括 测试 和 演示 都 涉及 Neo4j 的 服务 器 模式 。 由 于 这 些 测试 的 大 部 分 是 使 用 不 同 的 选项 测量 与 性 能 有 关 的 
目标 ， 我 们 决定 使 服务 器 独立 于 其 运行 的 测试 启动， 以 得 到 尽 可 能 精确 的 测量 。 这 也 使 得 你 可 以 自己 设置 你 的 服务 器 。 

不 同 于 其 他 的 一 些 测试 ， 直 到 目前 还 是 使 用 基于 Java JUnit 的 测试 ， 第 10 章 与 性 能 有 关 的 性 能 测试 可 以 从 命令 行 通过 一 系列 
bash[] 脚 本 开始 。 

由 于 选 定 的 执行 一 些 性 能 测试 的 客户 端 之 一 仅仅 是 基于 UNIX 的 curl (http://curl.haxx.se) 客户 端 ， 性 能 测试 脚本 仅 能 以 


bash 脚 本 获得 ， 它 可 以 在 *nix 环 境 下 运行 。 如 果 你 用 的 是 Windows 操 作 系 统 ， 可 以 尝试 安 六 Cygwin (www.cygwin.com) ， 
它 提 供 了 一 个 仿真 Linux， 可 以 在 那里 运行 脚本 。 


1) 默认 情况 下 ， 当 运行 第 10 章 与 性 能 有 关 的 测试 的 标准 命令 mvn clean install 了 时， 它们 并 不 运行 。 如 果 看 控制 台 上 的 输 
出 ， 当 到 第 10 章 时 ， 你 会 看 到 一 些 如 图 B-1 所 示 的 输出 。 


code-samples — bash — 138x20 


LINFO] 
[EINHFO] ==- maven-Grtrun-plugln:1,7:rFun (defoulty B® ehapterid -portormarece=d emis Serve === 
[INFO] Executing tasks 
Rtn 
Lecho] ee 
[Benaj] 坦 
[echa] # Chopter 1 = Server Performnce Reloted Tests ond Demos 
[echej] 害 
[eeha] # Please Note: 
[echa] # C1 By defoault, mst ef the pertformarnce reloted tests / denos Cespeclioally thase 
[aeha] # Faquiring a stondalo eryer to have Baan storted, ara not Fufi autondticoally 
[eeha] # Gs port of the stardard mv lifecyele. 
Lecsha] # C2 In order to run these performnce related tests / demes, please consult 
[echo] é# oppendix B for instructions on how to setyp 
[echo] # ond configure &@ stoandalone Mecd] serwer dn order to run the assoclated 
[echo] 者 scripts ogoirnst, 
[achoj 者 
[echo] 8 ----—------——--- = 人 = 一 = 一 一 = 
[TNFO] Executed tasks 


图 B-1 默认 时 第 10 章 的 Maven 输 出 


这 是 值得 期 竺 的， 这 样 是 为 了 确保 基本 测试 能 够 在 没有 事先 安 疼 Neo4j 服 务 器 时 都 能 运行 ， 否 则 要 等 很 长 时 间 才 能 运行 这 些 
性 能 测试 。 接 下 来 的 说 明 给 出 了 额外 的 详细 步骤 运行 与 性 能 相关 的 演示 和 测试 。 


2) 要 运行 一 些 蔚 入 式 的 与 性 能 相关 的 测试 ， 以 Maven 配 置 文件 运行 Include-embedded-perfdemos: 


mn clean test -£f chapterld0 /performance-demos-embedded/pom.xml -P 
include-embedded-perftdemos 


3) 按照 附录 A 的 详细 安 妆 步骤 安 半 单一 的 Neo4j 服 务 器 ( 样 例 使 用 版 本 2.0.1) 。 我 们 将 参考 Neo4j 服 务 器 的 安 儿 目录 
<<NEO4J HOME> >。 


4) 在 <<NEO4J HOME> >/conf/neo4j-server.properties 的 文件 中 ， 
a) 确保 通过 修改 如 下 所 示 的 属性 值 将 Neo4j 服 务 器 数据 库 设 置 到 性 能 测试 所 期 待 的 位 置 。 


Org .neo4] .Server,.database. location=<<NAJIA SAMPLE HOME>>/chapterl10)/ 
performance-demos-server/the-chapterl0-server-db 


b) 确保 非 托管 扩展 (在 接 下 来 的 步骤 中 将 会 安 疼 ) 已 经 注册 。 这 可 以 按 如 下 所 示 取 消 和 修改 下 列 的 属性 值 实现 。 


DT 可 .neocd4] .server.thirdparty Jaxrs classes=com.manning.neo4]ia.chapter 
10.unmanagedext=/n4jia/unmanaged 


5) 假设 你 已 经 成 功 运行 了 一 个 普通 的 mvn clean install， 那 么 一 个 包含 服务 器 插件 和 扩展 的 jar 文 件 就 会 在 这 里 产生 。 
<<NAJIA SAMPLE HOMES>»>/chanpterl0/server/target/chapterl0-server-1.0- 
SNAPSHOT .Jar. CopYyY this file to the server's plugin directory located 
here: <<NEO4J HOME>>/PpPlugins. 

6) 在 终端 窗口 创建 并 传 出 一 个 NEO4J_HOME 变 量 ， 由 于 这 是 脚本 所 期 待 的 。 通 过 执行 以 下 的 命令 完成 这 项 工作 。 


export NEOQ4J HOME=<<NEQA4J HOME>> 


7) 转 到 根 目 录 ，bash 脚 本 会 在 根 目 录 运 行 : <<N4JIA SAMPLE HOME> >/chapter10/performance-demos- 


server/src/test/scripts/bash., 


8) 通过 在 bash 目 录 中 执行 下 面 的 脚本 产生 性 能 数据 库 : 
:Seed performance db.sh 
你 现在 已 经 准备 好 运行 bash 脚 本 了 。 


9) 确保 你 还 在 根 目 录 下 ， 在 这 里 bash 脚 本 可 以 运行 : 


<<NAJIA SAMPLE HOME>>/chapterl0/performance-demos-server/src/test/ 
scripts,/bash. 


10) 运行 基于 bash 的 测试 : 
a) 运行 基于 curl 的 演示 /性 能 测试 脚本 ,使 用 这 条 命令 : 
/Curl adams friends .sh 
b) 运行 基于 Java REST 绑 定 的 演示 /性 能 测试 脚本 ， 使 用 这 条 命令 : 
/javarestbinding adams friends.sh 
全 注意 
由 于 这 是 一 个 JavaREST 客 户 端 ， 这 些 脚 本 实质 上 称 为 某 些 基于 Java 的 演示 /JUnit 后 台 测 试 。 


这 将 会 引出 相当 多 的 信息 。 如 果 你 感 兴趣 想 了 解 stopwatch 类 的 详细 情况 ， 建 议 以 下 面 的 方式 调用 脚本 : 


/javarestbinding adams friends.sh | grep StopWatch 


[1] bash 是 Bourne-Again Shell 的 缩写 ， 它 是 一 种 UNIX Shell。 译 者 注 


附录 C 设置 使 用 SDN 的 项 目 环境 


本 附录 将 市 看 你 浏览 完成 运行 SDN 所 需 设 置 的 讽 明 ， 帮 其 是 那些 针对 3DN 3.2.1 友 布 版 本 的 说 明 ， 这 一 版 本 是 官 万 友 布 的 与 
Neo4 2.1.5 版 相 兼 容 的 。SDN 3.2.1 帮 布 版 本 是 企 专门 介绍 SDN 的 章节 (第 10 章 ) 提 到 的 版 本 ， 也 是 本 书 附 审 代码 所 使 用 的 版 
本 。 


配置 你 的 项 目 以 使 用 SDN 最 容易 的 方法 是 通过 一 个 Maven 构 建 (build) ， 随 市 的 源 代码 也 是 使 用 它 实 现 的 。 安 和 和 设置 
Maven 的 通用 说 明 在 附录 B 中 给 出 。 如 果 你 愿意 ，SDN 也 能 够 使 用 Gradle 或 Ant/Ivy 构 建 ; 这 样 做 的 说 明 可 以 
在 http://docs.spring.io/spring-data/data-neo4j/docs/current/reference/html/#setup 找 到 |。 


本 附录 也 会 提供 使 合适 SDN 功 能 所 需要 的 最 低 Spring 配 置 的 详细 情况 。 


根据 是 否 使 用 简单 或 局 级 的 映射 模式 ， 设 置 会 有 一 点 不 同 。 第 9 章 的 源 代码 同时 为 简单 和 高 级 映射 模式 提供 了 一 个 配置 设 


最 新 的 一 些 说 明 ， 以 及 在 这 里 没有 指定 的 选项 ， 可 以 在 Michael Hunger 的 《Good Relationships》 中 找 
到 : http://docs.spring.io/spring-data/data-neo4j/docs/current/reference/html/#setup, 


SDN 版 本 和 官方 文件 参考 


本 书 是 针对 SDN 的 3.2.1 版 本 的 ， 与 Neo4j 2.1.5 版 本 兼容 。 就 像 你 能 理解 的 ， 写 一 本 书 并 试图 保持 最 新 版 本 的 公开 源码 一 直 以 
来 具有 很 大 的 挑战 性 。 为 了 确保 总 是 接触 到 最 新 的 信息 ， 我 们 一 直 在 努力 使 用 指向 最 新 稳定 版 本 的 官方 参考 文件 。 在 本 书写 作 
时 ， 所 有 的 SDN 文 件 URL 遵 循 一 个 共同 的 模式 ， 即 http://docs.spting'io/sptingdata/data-neo4j/docs/<vetsion> /teference/html， 这 里 
的 版 本 <vetsion> 是 你 布 望 阅读 的 SDN 版 本 ， 当 前 是 一 个 总 指向 最 新 、 最 稳定 发 布 版 本 的 别名 。 


对 3.2.1 版 本 的 专门 信息 ， 请 参阅 http://docs.spring.io/sprine-data/ data-neo4j/docs/3.2.1.RELEASE /reference/html。 对 最 新 的 稳 


定 版 本 ， 请 参阅 http://docs.spring.io/sptrine-data/ data-neo4j/docs/current/reference/html。 


C.1 Maven 配 效 


如 果 你 正在 使 用 Maven， 你 需要 确保 下 面 的 Maven 依 赖 组 之 一 (根据 情况 或 者 C.1 或 者 C.2) 包含 在 你 的 pom.xml 文 件 中 ， 
选择 取决 于 你 所 使 用 的 映射 方式 。 


下 面 的 程序 给 出 了 简单 映射 模式 的 依赖 : 


【程序 C-1】 简单 映射 模式 Maven 需 要 的 依赖 


<dependenciess 
dependency> 
<aroupId>org .springframework .datac /groupIds> 
<artifactId>sspring-data-neodj</artifactId: i 
“Spring-de ey ctio> SDN 主 依 赖 
<VeErslions>3,2.1.,RELEASE< /Versions> 


</dependency> 


<dependency> 
<groupId>org.hibernate</grouplId> 
<artifactId>hibernate-validator</artifactId> : i 
cvVversionsd4.2.0.Finalc/versgions API 的 Hibernate 洋 施 
</dependency»> 


JSR-303 Bean Walidation 专用 


</dependenciess 


从 理论 上 讲 ， 有 了 核心 spring-data-neo4j 组 件 就 已 经 足够 了 ， 但 是 在 现实 中 ， 当 前 还 需要 包括 一 个 其 他 的 库 ， 以 便 SDN 正 
确 发 挥 功 能 ， 这 就 是 JSR-303 Validation 专 用 API。 在 我 们 的 样 例 代码 中 ， 我 们 选择 了 Hibernate 实 现 。SDN 库 本 身 也 使 用 
Validation API， 因 此 用 户 需 要 在 运行 的 时 间 提 供 一 个 实际 的 实现 。 


SDN 库 的 简单 和 局 级 版 本 都 使 用 Maven 的 传递 依赖 管理 系统 以 确保 开 友 需要 的 文 持 库 目 动 下 载 。 
下 面 的 程序 给 出 了 高 级 映射 的 依赖 。 
【程序 C-2】 ”高 级 映射 模式 Maven 需 要 的 依赖 


<dependencies> 
<dependency> 
<groupId>org .springframework.data</grouplId> 
<artifactIdsspring-data-neoc4j-aspectsc/artifactIds SDN 主 焦 赖 (高 级 映射 槛 式 】 
<VeErsion»3.2.1.RELEASE </version> 
</dependency> 


<Qependency> 


<groupId>org .hibernate</groupld> JSR_303 Bean Validation 专用 
<artifactId>hibernate-validator</artifactIds 


和 A ; 上 API 的 Hibernate 实施 
<VersSlion>4.2.0.Final< /versions 


</dependency> 
</dependencies> 


对 于 简单 映射 模式 ， 你 将 会 需要 显 式 包括 对 一 个 具体 的 JSR 303 实 现 库 依赖 。 我 们 在 这 里 再 一 次 使 用 了 Hibernate 实 现 。 


除 这 些 依赖 本 身 ， 高 级 映 射 模式 需要 配置 Maven 构 建 以 使 用 AspectJ 在 构建 时 编排 入 口 。 下 面 的 程序 给 出 了 配置 的 部 分 代 
码 ， 这 些 代码 需要 添加 到 你 的 pom.xml 文 件 中 以 完成 这 项 工作 。 


【程序 C.3】 ”高 级 映射 模式 的 AspectJ 构 建 配置 


hullds 
<pPlugins> 
DLUuUdlny 
roupldsorg. Codehaus.mlo/gqrouplds 
“aartifactIid>agpecti] -maven-plugin</AaArtifactIds 
VEISION>] ,dc/ verslony” 
“EDendenclies 
<dependency> 
rouUpld>yo0rg.aspectj</groupIds> 
artifactIdsaspectjrt</artifactIlds 
<Versionsl1.7.4</Versions 
</:dependencys> 
“dependency> 
roupld>org.aspecti</groupIds 
<artifactId>aspect toolsc/ /artifactIids 
ETSIONsS1 .7.4</ Verslions 
</dependency> 
</dependenciess 
芯 怕 六 吧 忆 业 N93 
安 其 忆 CUt On» 
开 可 人 D 且 | 自 关 
Oal=oompmile</dgoals> 
qoal>test -complile</yoals 
/goals> 
/EXEeCUtiorn;»s 
< EXECGUt1Onss 
<COnfEigurations 
-OUtXMmL truec/ outxml> 
5DecCtLibrarles 
<apectLibrarys> 
<roupld>org. pringframework</grouplId> 
<artifactld>spring-aspectsec/artitiactIlds 
</aspectLibrary,s 
pectLibrarys> 
<Iroupldsorg. Bpringf ramework.data</groupld> 
“artifactId>sprindg-data-neod4i-aspectsc/artifactlId;s 
/ASDeECctLibrary>s 
</adpectLibrariess 
SOUrCe>l,. Te/SOUrCe> 
<targetsi, Tc/targets 
/eonficaurations 
/plugins 
HPLUudlns> 
</builds 


C.2 Spring 配置 


本 节 讨 论 在 应 用 程序 中 安 六 和 配置 Spring 都 需要 什么 。 安 六 相对 来 说 很 简单 ， 因 此 ， 即 使 你 不 熟悉 Spring， 也 不 会 有 什么 


问题 。 


Spring 本 身 的 设置 可 以 通过 一 个 XML 文件 或 通过 Spring Java bean[1j 配 置 (使 用 @Configuration 注 释 ) 实现 。 由 于 在 写 书 
时 大 部 分 的 SDN 文 件 使 用 XML 提供 例子 ， 我 们 也 这 样 做 ， 但 是 ， 你 可 以 在 Michael Hunger 的 《Good Relationships》 的 第 21 
章 碍 找 如 何 使 用 Java Bean 方 法 : http://docs.spring.io/spring-data/data-neo4j/docs/current/reference/html/#setup。 


1. 核 心 XML 配置 


你 需要 告诉 Spring 需 要 创建 和 示例 什么 样 的 组 件 。 用 XML 方 法 ， 通 过 提供 一 个 有 如 下 所 示 的 具有 初始 化 内 容 的 XML 文 件 实 


现 。 


【程序 C-4】 ”使 用 存储 目录 配置 XML 


A ll 


“XM] Version="1.0 


encoding="UTF-8" standalone="yes'"?> 


<beans xmlns="http:/ /www,springframework .org/schema/beans" 
xmlns:context="http:/ /www. springframework.org/schema/context" 
xmlns:xXsl="http:/ /www.w3.o0rg/2001/XMLSchema-instance" 
xmlns:neoc4j="http:/ /wow. springframework.org/schema/data,/neo4j" 
xsl:schemaLocation=" 


http: 
http: 
nttp: 
nttp: 
http: 


http 


COnNntext 


六 WwW 


Www . 
/i WWW . 
/WwW . 
:Www . 


:WWW . 


<neoa] :configa 
storeDirectory="target/contigq-test" 
base-package= "com.manning.neo4ijia.chapter08 .simple.domain'"/s> 


< /beanss 


.Springframework. 
springframework. 
sprinaframework. 
springframework. 


annotation-config/> 


sprlnogftramework. 
springframework. 


DL 可 /Schema/ Deans 
org/schema/beans/spring-beans .Xad 
org/schema/context 
org/schema,/context,/spring-context ,xsd 
org/schema/data/neod4] 
org/schema/data/neo4ij/spring-neo4i] .xsd'"» 


“| 六 和 在 bean 类 中 检测 到 的 各 种 注 各 


使 用 Neo4j 名 字 空 间 简 洁 定 义 基 本 


SDN 配置 


Neo4j 专 用 XML 名 字 空 间 单元 neo4 : config 提 供 了 一 种 简洁 的 配置 SDN 的 方法 。 它 创建 或 给 出 核心 图 形 数据 库 类 以 及 其 他 
帮助 类 ， 例 如 Neo4jTemplate。 


neo4j: config 单 元 本 身 具 有 四 个 可 配置 的 属性 (storeDirectory、graph-DatabaseService、entityManagerFactory 和 和 
typeRepresentationStrategyFactory) 。 为 了 方便 ， 有 一 个 storeDirectory 属 性 ， 当 将 指针 设置 到 一 个 特定 的 目录 时 ， 如 果 没 
有 EmbeddedGraphDatabase 文 件 (如 果 已 经 有 了 ， 束 使 用 它 ) ， 将 会 创建 一 个 新 的 EmbeddedGraphDatabase 文 件 。 这 是 样 


本 代码 中 使 用 的 万 法 。 


你 可 以 使 用 graphDatabaseService 属 性 指向 一 个 特定 的 先前 配置 的 可 以 使 用 的 Neo 和 实例 。 在 那 种 情况 下 ， 你 也 要 定义 一 
个 factory bean 创 建 一 个 适当 的 Neo44j 实 例 ， 如 下 面 的 程序 片段 所 示 : 


<neod4j:config graphDatabaseService="graphDatabaseService" /> 


<bean id="graphDbFactory" 
lass="Org.neo4j] .graphdb .factory.GraphDatabaseFactory"/> 


<bean id="graphDatabaseService" 


scope="S1n9gleton'" 


destroy-method="shutdown" 


factory-bean="graphDbFactory" 
factory-method="newEmbeddedDatabase'"»> 
<CONnstructor-arg value="target /config-test"/»> 


< /bearnys 


从 SDN 3.0 起 ，base-package XML 单 元 是 强制 性 的 ， 并 且 期 待 你 提供 所 有 包 的 列表 以 便 SDN 能 够 搜索 找到 你 的 注释 域 实 


体 。 如 果 要 使 用 交叉 存储 持久 性 ， 你 也 需要 提供 entityManagerFactory 属 性 值 (这 里 没有 给 出 示例 ) 。 


如 果 你 想 要 使 用 一 类 描述 策略 而 不 是 默认 的 策略 (SDN 3.x 的 默认 策略 是 基于 标签 ; SDN 2.x 的 默认 策略 是 基于 索引 延 
迟 ) ， 你 可 以 有 选择 的 定义 一 个 名 字 为 


org.springframework.data.neo4j.support.typerepresentation.TypeRepresentationStrategyFactory 类 型 的 


typeRepresentationStrategyFactory bean 类 ， 如 下 面 的 程序 片段 所 示 ， 为 第 二 个 构建 器 的 参数 选择 一 个 合适 的 值 。 


<bean ld="typeRepresentationstrateqyFactory" 
class="oOrg. springframework.data.necd4] .Support .typerepresentation.TypeRepresen 
tationstrategqvyFactory" > 
<COnstructor-ardg index="0" ref="gqraphDatabase'"/y> 
<CONnstructor-arg index="1" Vvalue="Indexed'" /> 


< /beans 


更 多 天 于 可 用 选项 的 内 容 能 够 在 Michael Hunger 的 《Good Relationships》 的 第 20 草 的 “实体 类 型 拉 述 ”一 节 找 
到 : http://docs.spring.io/spring-data/data-neo4j/docs/current/reference/html/#reference _ programming- 


model typerepresentationstrategy。 
更 多 配置 选项 请 参阅 官方 网 站 。 
2. 库 配置 


在 XML 的 配置 方法 中 ， 能 够 使 用 < neo4j: repositories> 单 元 配置 SDN 库 。 下 面 的 程序 片段 给 出 了 一 个 如 何 指导 spring 企 
com.manning.neo4jia.chapter09.simple.repository Java 包 内 查找 需要 使 其 作为 Spring beans 对 SDN 可 用 库 类 的 例子 。 


<Nneod] :repositories base-Dackages= 
com.manning.neo4ijia.chapter09.simple.repository"/> 


你 应 访 用 你 的 特定 库 实现 所 在 的 位 置 蔡 换 上 述 包 的 名 字 。 包 单元 定义 了 搜索 查找 库 的 根 包 (或 多 个 包 ) 。 


额外 的 SPRING 数 据 公 共 配 置 选项 


SDN 建 在 Spring Data Commons 项 目 提 供 的 基础 结构 和 库 的 上 部 。 通 过 SD Commons 获 得 的 额外 配置 选项 在 这 里 也 应 该 工作 。 
Spring 如 何 若 道 到 哪里 查找 XML 配 置 文 件 ? 

简单 来 说 这 需要 你 告诉 它 ， 但 是 通常 取决 于 你 正在 创建 什么 样 的 应 用 程序 

如 果 你 在 建立 一 个 网 页 应 用 程序 ，Spring 网 页 框架 提供 了 一 个 定制 的 Context LoaderListener 类 ， 你 可 以 在 你 的 web.xml 文 件 中 


使 用 下 面 的 程序 片段 所 示 的 方法 创建 容器 。 注 意 在 这 种 情况 下 ，XML 配 置 文件 (applicationContext.xml) 从 它 在 WEB-INF 目 录 中 
的 位 置 被 引用 : 


<Context-param> 
<param-name>contextConfigLocationc/param-names> 
<param-value>/WEB-INF/applicationcontext ,xml</Daram-values> 
< /context -params> 


<]19gtener,>s 
<]istener-classs 
org. Sprinagframework .web.,context .ContextLoaderListener 
</listener-classs 
/listenerys 


另外 ， 如 果 你 在 建立 单机 Java 应 用 程序 ， 可 以 如 下 面 的 程序 片段 所 示 使 用 Class PathXmlApplicationContext 类 : 


ClassPathXmlApplicationContext ctx 

= new ClassPathXmlApplicationcontext ( 
"classpath:applicationcontext ,xml "),; 

UserReposlitory USerReposltory = Ctx.getBean (UserReposiltory.class).; 


用 配置 提供 给 Spring 的 其 他 方法 的 更 多 选 务 器 的 安装 目 ting 框 架 参 考 文件 的 “Spting IoC 容 器 和 beans 导 论 ” 一 


-大 


PP: http://docs.spring.io/spring/ docs/4.0.x/springframework-reference/htmlsingle/#beans-introductiono 


[1] Java 组 件 。 译 者 注 


附录 D ”获得 更 多 的 帮助 


当 你 的 Neo4j 邻 居 友 生 了 一 些 奇怪 的 事情 时 ， 你 将 找 谁 ? 
当然 是 社区 ! 


因为 这 是 一 个 源码 公开 项 目 ， 有 一 个 宽泛 和 多 样 的 Neo 笑 社区， 他 们 愿意 帮助 你 解决 问题 ， 如 果 你 选择 参与 其 中 并 也 为 这 个 
项 目 奉献 ， 他 们 也 是 很 愿意 的 。 下 面 的 资源 是 你 可 以 去 寻求 帮助 的 ， 并 且 你 也 可 以 为 其 添砖加瓦 。 


市 着 你 的 问题 寻找 答案 ,或 找到 开发 伙伴 : 
http://stackoverflow.com/questions/tagged/neo4 
与 你 的 图 形 数 据 库 伙伴 分 享 你 的 经 验 与 专业 知识 : 
http://groups.google.com/group/neo4).。 

上 友 现 一 个 Neo4j 的 问题 ”在 这 里 提出 来 : 
https://github.com/neo4j/neo4j/issues, 


Neo4j 聚 会 遍布 全 世界 。 连 接 或 自己 开始 一 个 新 组 : 


SN 
三 | stackoverflow 


(GTAP 
Meeturp 


